1.零一万物Yi-VL多模态大模型开源，MMMU、CMMMU两大权威榜单领先

1 月 22 日，零一万物 Yi 系列模型家族迎来新成员：Yi Vision Language（Yi-VL）多模态语言大模型正式面向全球开源。据悉，Yi-VL 模型基于 Yi 语言模型开发，包括 Yi-VL-34B 和 Yi-VL-6B 两个版本。

Yi-VL 模型开源地址：

2.大模型学会听音乐了！风格乐器精准分析，还能剪辑合成

3.OpenAI CEO 本周访韩，预计将与SK集团会长讨论AI芯片合作

韩国东亚日报称，阿尔特曼本周访问韩国首尔，期间可能同 SK 集团会长崔泰源会面，或讨论人工智能芯片合作事宜。还有猜测称，阿尔特曼可能会与三星电子讨论代工和 HBM 合作事宜。

4.日报小编最快下岗，MultiOn和model labs合作

5.Orion-14B-Chat：基础模型在2.5T多语言语料库上进行训练，包含中文、英文、日语、韩语等等

Orion-14B 系列模型是OrionStarAI从头开始训练的开源多语言大型语言模型。基础模型在2.5T多语言语料库上进行训练，包括中文、英文、日语、韩语等，它在这些语言上展现出卓越性能。

6.demo-ai-app

借助AI，帮助用户更准确的搜索需要的电影，用户可以通过对情节和电影画面描述进行搜索。

7.InstantID

InstantID是一个进行零样本身份保留图像生成的项目。它可以在保留给定身份的同时生成高质量图像。

该项目提供了无条件和类条件图像生成的代码和模型,同时保留给定的身份。

它在训练过程中使用了一个新的身份先验损失(IPL),以区分身份和其他属性,如姿势、表情等。这使得可以在保持身份不变的情况下,生成一个人不同姿势/风格的新图像。

核心模型架构基于StyleGAN2。他们添加了IPL损失,并在像FFHQ和AFHQ这样的数据集上进行训练,以实现身份保留的图像生成。

8.cartbuddygpt

CartBuddyGPT是一款由GPT驱动的购物助手，简化用户的在线购物体验。用户可以通过查询或请求与CartBuddyGPT交互，然后通过人工智能来解析大量的产品目录，以满足用户的特定需求和预算，提供包含详细信息的产品列表，如标题、价格、客户评级和其他关键属性，这些信息以易于访问的格式呈现。

Provide feedback

Saved searches