1.大模型也能切片,微软SliceGPT让LLAMA-2计算效率大增
一般来讲,这些模型压缩技术可以分为四类:蒸馏、张量分解(包括低秩因式分解)、剪枝和量化。其中,剪枝方法已经存在了一段时间,但许多方法需要在剪枝后进行恢复微调(RFT)以保持性能,这使得整个过程成本高昂且难以扩展。
为了解决这一问题,来自苏黎世联邦理工学院、微软的研究者提出了一个名为 SliceGPT 的方法。SliceGPT 的核心思想是删除权重矩阵中的行和列来降低网络的嵌入维数,同时保持模型性能。
论文链接:https://arxiv.org/pdf/2401.15024.pdf
2.马斯克:Neuralink首次将芯片植入人体,产品已在路上
https://www.reuters.com/technology/neuralink-implants-brain-chip-first-human-musk-says-2024-01-29/
3.一款基于自研代码大模型打造的 AI 代码助手 ——Fitten Code
产品官网地址:https://code.fittentech.com/
4.小扎官宣Code Llama重量级更新,新增70B版本,但还有能力限制
Code Llama 70B 提供与之前发布的 Code Llama 型号相同的三个版本:
CodeLlama - 70B,基础代码模型;
CodeLlama - 70B - Python,专门面向 Python 的 70B;
Code Llama - 70B - Instruct 70B,它针对理解自然语言指令进行了微调。
参考链接:https://www.theverge.com/2024/1/29/24055011/meta-llama2-code-generator-generative-ai
5.讯飞星火开源-13B 大模型发布,针对国产软硬件环境深度优化
https://gitee.com/iflytekopensource/iFlytekSpark-13B
https://xinghuo.xfyun.cn/openSource
6.Jina AI 发布中英和英德双语 8K 向量模型,即刻开源!
中英双语向量模型: https://huggingface.co/jinaai/chinese-english-embeddings
英德双语向量模型: https://huggingface.co/jinaai/english-german-embeddings
7.微软发布年度AI工作报告:使用ChatGPT,牺牲一些准确性,提高知识工作者工作速度37%
微软发布了年度《工作未来》报告,这次的主题不是远程工作,而是人工智能。 (括号内为幻灯片编号)
-
使用 ChatGPT 的知识工作者速度提高了 37%,质量提高了 40%,但准确性降低了约 20%。简单的用户体验解决方案可以解决这个问题。 (6)
-
来自 Microsoft Copilot 365 企业用户的调查(7):
-
73% 的人同意 Copilot 可以让他们更快。
-
85% 的人表示这将帮助他们更快地获得良好的初稿。
-
72% 的人同意在平凡或重复性任务上花费更少的脑力劳动。
-
大多数早期研究发现,新工人或低技能工人从LLMs中受益最多。技术水平较低的工人提高了 43%,而技术水平较高的工人则提高了约 17%。 (8)
-
助理需要与挑衅者配对,即基于 LLM 的工具,挑战假设、鼓励评估并提供反驳。 (9)
-
人工智能可以帮助将简单的命令分解为微时刻和微任务,从而提高整体质量和效率。 (10)
-
分析和整合人工智能生成的信息可能比搜索和创建信息更重要。与内容制作不直接相关的技能(领导、社交互动、信任问题或情感意识)可能更有价值。 (11)
-
提示很难,但人们正在变得越来越擅长。微调/使用 LLMs 生成提示也使其变得更容易。提示模板对最终用户很有帮助。 (12-14)
-
突出显示错误/不确定性百分比有助于平衡对 LLMs 的依赖。可以使用协同审核工具来补充提示,以检查 LLM 输出。 (17-18)
-
生成式人工智能需要自我意识和良好的信心。同时,它也可以帮助实现这一目标。 (19)
-
创意活动是一个过程,LLMs 可以帮助跨越不同的部分。 (21) 69% 的 Bing Chat 对话属于专业任务领域。 (22)
-
基于 LLM 的搜索(其中 36%)比传统搜索(13% 复杂)复杂。 (22)
-
在一项针对 69 名学生的研究中,Codex 的使用提高了他们学习 Python 的表现,但并没有影响他们手动修改代码的能力。 (24)
-
LLMs 可以快速分析人类数据并生成合成数据。这将改变社会科学研究的方式。 (27)
-
LLMs在会议中可以解决不同的问题,例如平等参与(即时反馈)和更好的互动(回顾性反馈)(28-29)。
-
人工智能可以帮助委派管理职责,使高管能够专注于团队愿景。 (30)
-
现代办公知识存在于聊天中,而不是文档中,但在员工聊天中应用人工智能是很棘手的。 (31-32)
-
大约。 80% 的美国劳动力至少有 10% 的工作任务受到 GPT 的影响。大约 19% 的员工 50% 的任务可能受到影响。 (38)
-
“创新与自动化”通常是比“替代与增强”更好的框架。人口增加仍然可能意味着失业。重要的是要尝试追踪人类劳动力是否以及在何处以创新的新方式被使用。 (39)
-
问题不应该是“人工智能将如何影响工作?”,而应该是“我们希望人工智能如何影响工作?” (40)