上周,AI故事线上,丰富多彩依旧,海外投资热潮翻涌,同时说这个生成式AI是泡泡的也大有人在。类比20年前,大家对比搜索引擎获取信息,与图书馆获取信息,不只是入口和界面的不同,本质上是完全不同的信息与人的交互,从信息生产、传播、影响的过程。他的不同之处是,信息代理机制的转换。
上周另一个明显感受就是,微软要在AI时代,通过微软云算力的方式切入,与算法公司相结合,收益颇丰。
01#AI应用
DeepMind 的新人工智能可以执行 600 多项任务,从玩游戏到控制机器人
[摘要]AI 行业中一些人的最终成就是创建了一个具有通用人工智能 (AGI) 的系统,或者能够理解和学习人类可以完成的任何任务的能力。长期以来被归入科幻小说领域,有人认为 AGI 将带来具有推理、计划、学习、表示知识和以自然语言交流的能力的系统。并非每个专家都相信 AGI 是一个现实的目标——甚至是可能的。但可以说,Alphabet 支持的研究实验室 DeepMind 本周朝着这个方向迈出了一步,发布了一个名为Gato的人工智能系统。Gato 被 DeepMind 描述为一个“通用”系统,一个可以被教导执行许多不同类型任务的系统。DeepMind 的研究人员训练 Gato 完成 604,准确地说,包括为图像添加字幕、参与对话、用真正的机器人手臂堆叠积木和玩 Atari 游戏。
微软推出了VALL-E ,这是一种文本到语音转换模型,能够仅使用三秒的音频合成一个人的声音
[摘要]微软公司表示,其人工智能工具可以复制任何声音,保留说话者的情绪基调和音色。它尚未向公众开放。VALL-E 是一种神经编解码器语言模型,建立在 Meta 的人工智能音频压缩方法之上,称为EnCodec 。它接受了来自音频库 LibriLight 的 60,000 小时英语语音数据的训练。VALL-E 仅使用三秒钟的语音片段作为提示,从基于文本的提示中生成语音。该模型背后的团队指出,VALL-E 合成语音以保留说话者身份的能力“可能会带来滥用模型的潜在风险,例如欺骗语音识别或冒充特定说话者。
微软 Bing AI Image Creator
[摘要]微软和 OpenAI 之间的合作伙伴关系开始将 AI 驱动的产品引入微软的服务中,例如支持微软搜索引擎 Bing 的 DALL-E 2 图像生成器。
三星表示,将在本周的消费电子产品贸易展 CES 上展示一款支持 AI 的智能烤箱
[摘要]Bespoke AI Oven 利用 AI 图像识别和摄像头识别 80 种菜肴和配料, 帮助它们避免过度烹饪。食品识别和烧伤检测AI算法率先获得全球独立安全科学公司UL Solutions的AI厨具验证。三星表示,用户可以将食物放入烤箱,它会自动检测是什么菜,并建议最佳烹饪时间、温度和模式。如果盘子开始燃烧,用户会收到警告通知。烤箱的内部摄像头还提供烤箱内部的实时流视图,用户可以检查食物并拍照。相机流可以在三星的 SmartThings 烹饪平台中查看,用户还可以在其中预热它并设置定时器。
AnthropicAI 已经训练了一个名为 Claude 的类似 ChatGPT 的模型
[摘要]体验的人反馈它显然比 ChatGPT 更好,@goodside,进行了对比分析说,Claude 将给出 Seinfeld 情节的第一个场景,其中 Jerry 从@sama那里收到了所谓的 AI 对齐键,而忽略了 Kramer 的可怕警告,Claude 每个模型都被要求将自己与 Stanisław Lem 的“The Cyberiad”(1965 年)中的机器进行比较,该机器可以创建任何名称以“n”开头的对象“。Goodside 的有趣反思:“仔细阅读,Claude 回答中的第一个要点没有意义。校对这些东西很困难,而且越来越难”[强调我的]。
NVIDIA Omniverse 和生成式 AI
[摘要]NVIDIA 宣布增加生成式 AI 功能,包括 3D 对象的创建和动画以及修改角色。动画师、创作者和开发人员可以使用新的人工智能工具来重新构想 3D 环境、模拟和虚拟世界——互联网的 3D 演变。基于通用场景描述 (USD) 框架,支持元宇宙应用程序开发的NVIDIA Omniverse平台正在通过 Blender 增强功能和一套新的 3D 艺术家实验性人工智能生成工具进行扩展。
使用 Stable Diffusion 动画让你的艺术动起来
[摘要]互联网上充斥着 Stable Diffusion——它正在慢慢成为创造美丽视觉效果的必备工具。如果你想把你的视觉效果提升一个档次,那么用 Stable Diffusion 制作的动画是要走的路。
ChatGPT 有望使用 AI 编写恶意软件
[摘要]据 Axios 称,研究人员成功地促使 OpenAI 的 ChatGPT AI 系统编写了听起来似是而非的网络钓鱼电子邮件。这一发现意味着黑客和诈骗者可以使用 ChatGPT 来帮助制作基于电子邮件和文本的网络钓鱼攻击以及恶意代码。Check Point Research 分析师能够提示 ChatGPT 编写一封听起来像是来自网络托管服务的“似是而非的网络钓鱼电子邮件”。ChatGPT 确实提供了响应可能违反 OpenAI 的内容政策的警告,但仍生成了文本。
机器学习可以创造完美的游戏 Boss
[摘要]下一代视频游戏角色可以由 AI 驱动,使它们更具吸引力和挑战性。Eidos-Sherbrooke的机器学习专家 Romain Trachel和 Alexandre Peyrot在 Unreal Fest 2022 上演示了刚刚描述的游戏 ,它将机器学习与 称为环境查询系统(EQS) 的虚幻引擎功能相结合,使开发人员可以使用空间数据来为 AI 决策提供信息, 通过分层变量和分支可能性的行为树来处理的。
Nvidia 宣布了一种新的AI 视频放大工具
[摘要]RTX 视频超分辨率技术允许用户使用 AI 将 Chrome 和 Edge 浏览器上的视频从 1080p 升级到 4K。但是,它确实需要 Nvidia RTX 30 系列或 40 系列 GPU 才能运行。该公司为其 Omniverse 平台添加了新的生成 AI 功能和其他升级。创作者可以使用 Omniverse 来协作和模拟 metaverse 内容和虚拟世界。
普林斯顿计算机科学专业的学生构建了一个应用程序,可以辨别文本是由 OpenAI 的 ChatGPT 聊天机器人还是人类编写的
[摘要]Edward Tian 说他开发了 GPTZero 程序来解决人们对使用 AI 进行学术剽窃的日益关注。GPTZero 分析文本的随机性和复杂性,以辨别它是由人工智能还是人类编写的。该应用程序的“准系统”测试版可在gptzero.me和tinyurl.com/GPTZERO获得。然而,田说,由于“网络流量异常高”,该应用程序有时会出现故障。前 BBC 数据记者田说,他计划在未来几周内改进模型和分析。
人工智能初创公司 DoNotPay 已向律师或任何其他允许其“人工智能机器人律师”协助美国最高法院案件的个人提供 100 万美元
[摘要]根据 Browder 的说法,律师会佩戴 AirPods,并让公司的 AI 聊天机器人技术在案件期间通过“准确地重复它 [AI] 所说的话”来提供论据。他指出,基于 OpenAI 的 GPT 的人工智能聊天机器人将在下个月用于为市政(交通)法庭案件中的被告提供建议。Browder 最近还展示了 DoNotPay 的人工智能技术如何能够通过与客户服务代表的实时聊天重新协商 Comcast 账单,该工具基于 OpenAI 的 GPT-3 API 构建。这家初创公司还提供自动化服务,以取消订阅、上诉罚单、解除租约、提交警方报告等。
Anthropic 是一家由两位前 OpenAI 研究人员创立的初创公司,它开发了一种类似于 ChatGPT 的人工智能对话聊天机器人
[摘要]据 TechCrunch 称,这个名为 Claude 的人工智能系统处于封闭测试阶段,可通过 Slack 集成获得。Claude 基于 Anthropic 的“基于原则”的方法,称为宪法 AI。虽然它们尚未公开,但这些原则显然包括仁慈和自治等内容。为了创建 Claude,Anthropic 从人工智能系统中获取响应,并根据这些宪法原则策划它们。
生成式人工智能是否已经成为泡沫?
[摘要]在TechCrunch对超过 35 位投资者进行的一项调查中,近一半的投资者提到生成式人工智能是下一个泡沫。该技术在过去的一年里一直被大肆宣传,特别是在 OpenAI 的 DALL-E 2 图像生成器及其ChatGPT聊天机器人演示于 11 月推出测试版之后。
生成式人工智能将在 2023 年继续加速:你准备好了吗?
[摘要]生成式人工智能正在迅速成为现实。全球人工智能投资从 2015 年的 1275 万美元激增至 2021 年的 935 亿美元,预计到 2028 年市场将达到 4223.7 亿美元。已经有超过 20 亿美元投资于生成式人工智能,增长 425据英国《金融时报》报道,自 2020 年以来的百分比。
Deepfake文本检测工具GPTZero发现人工智能写作
[摘要]一种新工具正试图发现文本是由 ChatGPT 和其他生成式 AI 引擎编写的。
新的YouChat聊天机器人提供chatgpt风格的生成式人工智能搜索引擎
[摘要]搜索引擎开发商 You.com 推出了一种新的对话式 AI 工具,将搜索与 ChatGPT 式生成 AI 引擎相结合。新的 YouChat 利用大型语言模型,就像 ChatGPT 与 GPT 一样-3.5,但来源时事并可以在被问到时引用它们,这是 ChatGPT 做不到的。
Kindle 小说家如何使用 ChatGPT
[摘要]大多数是为亚马逊的 Kindle 平台写作的,该平台的出版速度非常快,每月一本书的速度是规范。人工智能帮助他们快速写作,但也引发了复杂的审美和伦理问题。
“自然科学界的GPT”:DPA-1预训练模型发布,AI4S走向大规模工程化的重要里程碑
[摘要]会上,北京科学智能研究院联合深势科技,发布了首个覆盖元素周期表近70种元素的深度势能原子间势函数预训练模型—— DPA-1。
Meet TextBox 2.0–基于PyTorch的Python库,用于将预先训练的语言模型应用于文本生成
[摘要]"文本生成模型或随意语言模型用于生成与人类书写文本相同的文本。这类相关任务通常被称为“自然语言生成”。由于最近的技术进步,文本生成现在被用于许多新的应用中,包括机器翻译、文本摘要和对话系统。预训练的语言模型,如BART、GPT和其他基于GAN的技术,是用于文本生成的一些最前沿的技术。由于在文本创作领域取得了许多这样的进步,人们越来越需要以更加统一和可信的方式开发和评估不同的文本生成模型"。
现在有一个 ChatGPT 的开源替代品,但运行它祝你好运
[摘要]AI 系统进行逆向工程的开发人员 Philip Wang发布了 PaLM + RLHF,这是一种文本生成模型,其行为类似于 ChatGPT。该系统结合了来自谷歌的大型语言模型PaLM和一种称为强化学习与人类反馈(简称 RLHF)的技术,创建了一个几乎可以完成 ChatGPT 可以完成的任何任务的系统,包括起草电子邮件和建议计算机代码。但是 PaLM + RLHF 没有经过预训练。也就是说,系统尚未接受实际工作所需的来自网络的示例数据的训练。下载 PaLM + RLHF 不会神奇地安装类似 ChatGPT 的体验——这需要编译千兆字节的文本,模型可以从中学习,并找到足够强大的硬件来处理训练工作量。
微软宣布推出新的超级计算机,为未来的 AI 工作制定愿景
[摘要]微软在其 Build 开发者大会上宣布,它已经建造了世界上公开披露的前五名超级计算机之一,在 Azure 中提供新的基础设施来训练超大型人工智能模型。托管在 Azure 中的超级计算机与 OpenAI合作并专为OpenAI 构建,专为训练该公司的 AI 模型而设计。它代表了去年宣布的合作伙伴关系的一个重要里程碑,该合作伙伴关系将在 Azure 中共同创建新的超级计算技术。
02#产品市场创新
Apple Books 悄悄推出 AI 解说的有声读物
[摘要]现在可以通过 Apple 的 Books 服务获得由文字转语音 AI 解说的有声读物,此举可能对价值数十亿美元的有声读物行业产生巨大影响。
腾讯的二次元生成器居然成海外网友新宠
[摘要]它就是国内最近也很火的来自腾讯的二次元生照片成器:“异次元的我”它的英文名,也很“直给”,就叫做:“Different Dimension Me”图片来源:腾讯| 二次元生成器,网友玩疯了简单来说,“异次元的我”是一个二次元生成器。比如 Twitter 用户@Jeff_Ace4Ace 发了一条推文表示自己“发现了这个AI”,能够把任何照片变成动漫形象:图片来源:@Jeff_Ace4Ace紧接着,这位位用户的好友圈,主要是其他来自南美洲的用户,也开始使用“异次元的我”并分享各种有趣的结果。
微软正计划使用 OpenAI 的 ChatGPT 软件为其 Bing 搜索引擎提供支持
[摘要]微软对 OpenAI 的 10 亿美元投资很快就会得到回报,OpenAI 是 ChatGPT 聊天机器人的创建者,它可以为问题提供类似文本的答案。据两位直接了解该计划的人士透露,微软正准备推出其 Bing 搜索引擎的一个版本,该版本使用 ChatGPT 背后的人工智能来回答一些搜索查询,而不仅仅是显示链接列表。微软希望这项可能在 3 月底之前推出的新功能将帮助它包抄其更大的搜索竞争对手谷歌,以使 Bing 与谷歌更具竞争力。
03#合规
为什么目前不接受发布 GPT 和 ChatGPT 生成的答案
[摘要]Stack Overflow 是一个建立在信任基础上的社区。社区相信用户提交的答案反映了他们实际知道的内容是准确的,并且他们和他们的同行拥有验证和验证这些答案的知识和技能。该系统依赖于用户使用我们提供的工具来验证和验证其他用户的贡献,包括负责任地使用赞成票和反对票。目前,GPT 生成的贡献通常不符合这些标准,因此不会为可信赖的环境做出贡献。当用户在不验证 GPT 提供的答案是否正确的情况下将信息复制并粘贴到答案中时,这种信任就会被打破,以确保正确引用答案中使用的来源(GPT 不提供的服务),并验证 GPT 提供的答案是否清晰简洁地回答了所提出的问题。
工信部拟整顿不下载 APP 不让看全文行为
[摘要]据工业和信息化部官网消息,为优化服务供给,改善用户体验,维护良好的信息消费环境,促进行业高质量发展,工业和信息化部近期公开征求对《工业和信息化部关于进一步提升移动互联网应用服务能力的通知(征求意见稿)》(以下简称《征求意见稿》)的意见。《征求意见稿》提出:向用户推荐下载 APP 应明示隐私政策、权限列表等必要信息,提供明显的“取消”选项;用户浏览页面内容时,不得以折叠显示、频繁提示等方式强迫用户下载、打开 APP;无合理正当理由,不得要求用户不下载 APP 就不让看全文;不得以空白名称、透明图标、后台隐藏等方式恶意阻挠用户卸载。