产业资讯
Meta引领开源AI领域,推出新的文本转音乐模型
首席执行官马克·扎克伯格最近在一档播客中讨论了他开源重要昂贵的AI工具的目标。这个音乐生成代码、模型权重和评估的集合就是一个例子。它可以让你生成既有旋律条件又有文本条件的音乐。代码完全开源,但模型权重不对外商业开放。
可汗学院的 Khanmigo 聊天机器人
可汗学院推出了一款名为 Khanmigo 的基于人工智能的聊天机器人,旨在为学生提供个性化辅导。该机器人由GPT-4驱动,提供广泛的学科指导,并使用苏格拉底方法鼓励学习者独立解决问题。尽管支持者认为这类机器人可能会改变教育,但对技术的错误潜力和对教师角色影响的担忧仍然存在,目前正在对其有效性进行研究,以便在美国学校进行更广泛的推广。
稳定扩散将刻板印象推向极端
彭博社记者发现,稳定扩散将种族和性别差异推向比现实世界更糟糕的极端,引发了人们对生成式AI将会持续保留偏见的担忧。
工程研究
LLMs擅长欺骗你
探讨了LLMs的怪异人类特征以及它们在某些领域的潜力和麻烦。
ChatGPT只懂25个笑话
德国研究人员Sophie Jentzsch和Kristian Kersting发布了一篇论文,研究了OpenAI的ChatGPT-3.5理解和生成幽默的能力。他们发现ChatGPT对笑话的了解相当有限:在一次测试中,1008次生成中有90%是相同的25个笑话。
来自新加坡的多模态文本/视觉模型
该研究引入了许多新的缩略词。要点是研究人员收集了一个用于视觉指导调优的新数据集,训练了一个模型,并在过程中进行了一些算法调整。该演示非常令人印象深刻,尤其是在苹果AR发布之后。这是对未来AI助手可能的样子的令人兴奋的展示。
使语言模型在测试时更真实
众所周知,语言模型在自信地混淆(有时被称为幻觉)。事实证明,这些模型有一个关于真实性的内部表示,通过调整模型激活,可以引出真实的回答。研究人员发现,通过在经过指导调优的Alpaca模型上使用这种技术,他们将TruthfulQA的表现从32.5%提高到65.1%。
SpQR:高效的LLM压缩技术
这篇论文介绍了稀疏量化表示(SpQR),这是一种新的格式和技术,可以实现对大型语言模型(LLM)的几乎无损压缩,克服了量化带来的通常的准确性损失。SpQR使强大的LLM能够在笔记本电脑和手机等普通设备上运行,而不会降低性能,提供超过4倍的内存压缩增益和比传统方法更快的推断速度。
Matte Anything
在自动驾驶研究失去了一些动力之后,计算机视觉的进展似乎放缓了,但现在又重新加速。这种新颖的技术使用了三个图像模型的组合,以提高自然图像抠图的性能。结果非常令人信服。
密集像素跟踪取得突破,即使有遮挡
2015年,人们在用6D数值表示连续值方面取得了突破。这项工作在于他们提出将视频表示为3D体积。通过在该表示和像素空间之间进行匹配,他们可以对视频中的任意像素进行相当长期的跟踪。
效率资源
嘿,Alexa,学生们应该学习什么关于AI?
科技巨头、大学和非营利组织正致力于为学校的学生提供关于人工智能的课程。目前还没有关于该技术应该教授什么的全国共识。当前的课程涵盖了从AI的基础知识到如何编程Alexa的各种主题。
Lanarky
Lanarky是一个用于在生产环境中部署LLM应用程序的开源框架。
ClientZen
ClientZen利用人工智能将您的客户反馈转化为可操作的见解。
Gong Engage
Gong Engage是一种由客户互动驱动的AI销售参与解决方案。
延伸阅读
国会将考虑两项新的AI法案
美国参议员在周四提出了两项独立的跨党派人工智能法案,反映了人们对解决围绕该技术的问题的兴趣日益增长。其中一项要求美国政府在与人们进行AI互动时保持透明,另一项则设立了一个办公室,以确定美国是否在最新技术方面保持竞争力。
扫码获取资讯链接
查看原图 93K