1.零一万物Yi-VL多模态大模型开源,MMMU、CMMMU两大权威榜单领先
1 月 22 日,零一万物 Yi 系列模型家族迎来新成员:Yi Vision Language(Yi-VL)多模态语言大模型正式面向全球开源。据悉,Yi-VL 模型基于 Yi 语言模型开发,包括 Yi-VL-34B 和 Yi-VL-6B 两个版本。
Yi-VL 模型开源地址:
https://www.modelscope.cn/organization/01ai
2.大模型学会听音乐了!风格乐器精准分析,还能剪辑合成
论文地址:https://arxiv.org/pdf/2311.11255.pdf
https://github.com/shansongliu/M2UGen
3.OpenAI CEO 本周访韩,预计将与SK集团会长讨论AI芯片合作
韩国东亚日报称,阿尔特曼本周访问韩国首尔,期间可能同 SK 集团会长崔泰源会面,或讨论人工智能芯片合作事宜。还有猜测称,阿尔特曼可能会与三星电子讨论代工和 HBM 合作事宜。
4.日报小编最快下岗,MultiOn和model labs合作
https://twitter.com/DivGarg9/status/1749149133317996796?s=20
5.Orion-14B-Chat:基础模型在2.5T多语言语料库上进行训练,包含中文、英文、日语、韩语等等
Orion-14B 系列模型是OrionStarAI从头开始训练的开源多语言大型语言模型。基础模型在2.5T多语言语料库上进行训练,包括中文、英文、日语、韩语等,它在这些语言上展现出卓越性能。
https://huggingface.co/spaces/OrionStarAI/Orion-14B-App-Demo-CN
6.demo-ai-app
借助AI,帮助用户更准确的搜索需要的电影,用户可以通过对情节和电影画面描述进行搜索。
https://github.com/sst/demo-ai-app
7.InstantID
InstantID是一个进行零样本身份保留图像生成的项目。它可以在保留给定身份的同时生成高质量图像。
该项目提供了无条件和类条件图像生成的代码和模型,同时保留给定的身份。
它在训练过程中使用了一个新的身份先验损失(IPL),以区分身份和其他属性,如姿势、表情等。这使得可以在保持身份不变的情况下,生成一个人不同姿势/风格的新图像。
核心模型架构基于StyleGAN2。他们添加了IPL损失,并在像FFHQ和AFHQ这样的数据集上进行训练,以实现身份保留的图像生成。
https://github.com/InstantID/InstantID
8.cartbuddygpt
CartBuddyGPT是一款由GPT驱动的购物助手,简化用户的在线购物体验。用户可以通过查询或请求与CartBuddyGPT交互,然后通过人工智能来解析大量的产品目录,以满足用户的特定需求和预算,提供包含详细信息的产品列表,如标题、价格、客户评级和其他关键属性,这些信息以易于访问的格式呈现。