1.复旦等发布AnyGPT:任意模态输入输出,图像、音乐、文本、语音都支持
论文地址:https://arxiv.org/pdf/2402.12226.pdf
项目主页:https://junzhan2000.github.io/AnyGPT.github.io/
2.一句话让图片动起来,苹果发力大模型动画生成,可直接编辑结果
在一篇名为 「Keyframer: Empowering Animation Design using Large Language Models 」的研究中,来自苹果的研究者发布了一个可以利用 LLM 生成动画的框架 Keyframer,该框架允许用户采用自然语言提示来创建静态 2D 图像的动画。
论文地址:https://arxiv.org/pdf/2402.06071.pdf
3.OpenAI 在 2027 年实现 AGI
最新发布的这个 PDF 文档称,OpenAI「将在 2027 年前开发出人类水平的 AGI」,「从 2022 年 8 月就在训练 125 万亿参数的多模态模型」,而且已经「在 2023 年 12 月完成了训练」,但是「由于高推理成本取消了发布」。
https://drive.google.com/file/d/1xlRDbMUDE41XPzwStAGyAVEP8qA9Tna7/view
4.用MacBook部署本地大模型