1.字节让达芬奇和蒙娜丽莎“隔空吵架”,只需一张图、一段音频、一个情感片段
AIGC在视频生成领域展现出非凡的潜力。近期, 字节跳动智能创作团队和得克萨斯大学达拉斯分校又提出了一项名为DREAM-Talk的基于扩散模型框架:接收一段驱动的音频序列、一张给定的人像图片和一个情感风格的例子(一段有情感的讲话面部视频)作为输入,就能生成一段逼真的、嘴唇同步的讲话面部视频,其中包含高质量的情感表达,连画像也能绘声绘色地进行表演,还支持多个语种。
Arxiv: https://arxiv.org/abs/2312.13578
Project page: https://magic-research.github.io/dream-talk/
2.爆款图像工具Magnific背后:两个人的初创公司
最近,一个名为 Magnific 的图像超分 & 增强工具火了。Magnific 能够提高图像的清晰度和锐度,并且能够通过你的提示将画面中的细节补充完整,甚至在一些细微之处能够通过 AI 帮助你完成想象。这不仅在给图像升频,更是完成了对图像的再创造。
实际上,一些爆款应用背后的公司其实规模都很小。例如文生视频应用 Pika 背后的公司 Pika Labs 仅有 4 个人。大名鼎鼎的 MidJourney 在只有 11 个人的时候,就已经掀起 AI 作画浪潮。
传送地址:https://magnific.ai/
3.罗永浩暂缓AR业务转做大模型,细红线公司软硬件、算法团队半数裁员
4.OpenAI’s ChatGPT Enterprise Gains 260 Customers in First 4 Months
4个月内获取260个企业用户。
5.人们应该怀着GPT-5和AGI将在“相对较快”的时间内实现的心态来创业,大多数GPT-4限制将在GPT5中得到解决。
“不要解决我们想要解决的问题”这是我的解释。
https://twitter.com/H0wie_Xu/status/1745657992459272423?s=20
6.AI网关
https://github.com/Portkey-AI/gateway
7.promptwhisperer
AI Prompt 简化他们的工程流程并提高生产力
8.DragNUWA
基于开放区域的扩散模型视频生成模型