首页 > 生活感悟 > 免费教学 > 谷歌发布AI图像生成新工具Whisk,支持上传多张图片以图生图

谷歌发布AI图像生成新工具Whisk,支持上传多张图片以图生图

发布时间:2024-12-17 22:45:51来源: 15210273549

12 月 17 日消息,谷歌今日发布了一款名为 Whisk 的全新 AI 图像生成工具,该工具允许用户使用其他图像作为提示来生成图像,而不需要冗长的文本提示。用户只需提供图像,即可指定 AI 生成图像的主题、场景和风格。

 

使用 Whisk 时,用户可以为主题、场景和风格分别提供多张图像作为提示。(当然,用户仍然可以选择使用文字提示。)如果手头没有合适的图像,用户还可以点击骰子图标,由谷歌自动填充一些图像作为提示(这些图像似乎也是 AI 生成的)。此外,用户还可以在流程的最后阶段在文本框中输入一些文字,以添加关于目标图像的额外细节,但这并非必需步骤。

Whisk 随后会生成图像,并为每张图像生成相应的文本提示。如果用户对生成结果满意,可以选择收藏或下载图像;如果需要进一步调整,则可以通过在文本框中输入更多文字或点击图像并编辑文本提示来进行优化。

 

IT之家注意到,谷歌在一篇博文中强调,Whisk 的设计初衷是“快速的视觉探索,而非像素级的精细编辑”。该公司还表示,Whisk 可能会出现“偏差”,因此允许用户编辑底层的提示。

据体验者称,在短暂的使用过程中,Whisk 带来了有趣的体验。图像生成需要几秒钟的时间,虽然生成的图像有时会有些奇怪,但所有生成的内容都易于迭代修改。

谷歌表示,Whisk 使用的是其最新一代的 Imagen 3 图像生成模型,该模型也于今日发布。

免费教学更多>>

埃安霸王龙650智豪版VS宋PLUS EV520尊贵型,谁才是最佳出行搭子? 广汽零部件取得用于推杆式换挡器耐久试验的通用型换挡驱动机构和系统专利 特斯拉Model Y上新:FSD即将落地,AI智驾10倍安全,叫板小米YU7! 全新特斯拉Model Y上市!续航强、尺寸大,真的是电动SUV的未来吗? 《掌握这些相机拍照技巧,让你的照片脱颖而出》 2025新年南卡首款骨传导耳机发布,南卡Runner Air第一时间体验 i3默秒全再也看不到!AMD:Intel如今的CPU太差劲 导致我们不愁卖 传微软将携《光环》等游戏全力支持全新NS2主机 智能座舱与智能驾驶唱主角,车企国际消费电子展角逐智能化 从CES看AI风向:AI+产品层出不穷但实用性欠缺,自动驾驶日趋成熟 抖音更新了,全屏沉浸式模式给你一种全新的体验,鸿蒙Next版抖音 广州博冠取得直播中的交互方法及装置专利 全过程人民民主在上海|“民主的过程”(第二季)优秀短视频作品展播(五) 除夕车票开售在即,上京东搜“火车票”,PLUS会员领满99减5优惠 2025电商巨头纷纷布局!欧洲电商市场潜力解读 体验五菱星光S PHEV,续航1100km+四轮独悬,售9.98万起能买吗? 第一季度上市并交付, 国产全新宝马X3正式投产 2025长城汽车冰雪欢乐周:资深越野领导者教你如何玩转越野 吉利汽车与奇瑞汽车之争:谁能站稳自主厂商销量亚军位置? 长城汽车携核心车型与技术登陆CES 2025 12月厂商零售销量榜:比亚迪领衔,奇瑞第二,特斯拉排名提升 宁德时代与上汽集团再签约 零重力飞机工业与英武通航达成合作,发力eVTOL城市场景应用 太小气,黄子韬扬言送任何车型的车,结果是宝骏,仅5年使用权 关键时刻还得是长安汽车?你的长安在哪里? 实测本田思域,空间宽敞的运动轿车,1.5T地球梦发动机+优秀操控 帅呆!五羊本田NWG150真的来了,会成爆款吗? 同比大跌30.9%,本田中国2024年终端汽车销量852269辆 蝉联中国豪华品牌销量冠军,奔驰重申“坚守139年的长期主义” 比亚迪夏上市:2+2+3七座布局 1060公里续航