AI及信息技术应用2023年12月3日简报

微信邦 · 发表于 2023-12-4 08:39:11

本周在人工智能领域，OpenAI的领导层变动成为焦点，其中Sam Altman和Greg Brockman的归来预示着对AI安全和伦理的新关注。ChatGPT庆祝一周年，显示出AI应用的迅速增长。加州大学伯克利分校研发的AI清洁机器人，突显了AI在解决日常生活挑战中的潜力。此外，埃森哲对Ammagamma的收购和Covera Health的融资计划，进一步证明了企业对AI领域的强烈兴趣。监管方面，对ChatGPT训练数据泄露的研究和美国对阿联酋AI公司的调查，凸显了AI技术在全球层面的复杂性和监管的重要性。

1，AI产研应用

OpenAI 领导层回归：对人工智能领域的重大影响

[摘要]在经历一段不确定性和内部冲突后，Sam Altman 和 Greg Brockman 重返 OpenAI 的领导职务。这一变化标志着公司领导地位的稳定，可能会对人工智能安全、道德、战略合作伙伴以及整个人工智能研究领域产生广泛影响。新领导层的经验丰富性，以及他们可能更加重视负责任的人工智能开发，使得 OpenAI 重新焕发信心，同时也引发了关于合作伙伴关系和研究方向的关注。这一变化将成为人工智能社区动态和趋势的关键驱动力。

在ChatGPT成立一周年之际，其移动应用程序的安装量已超过11000万次，收入接近3000万美元

[摘要]ChatGPT 今天庆祝成立一周年。自12 个月前推出以来，ChatGPT 已成为历史上增长最快的消费科技应用程序之一，为人工智能公司带来了价值数十亿美元的投资，并引发了有关人工智能在社会中的作用的深刻问题。根据 Sametimeweb 数据，ChatGPT 于 2022 年 11 月 30 日向公众上线，第一周就获得了 1550 万次访问量。该平台的访问量迅速大幅上升，5月份达到了18亿的峰值。ChatGPT 的全球网络流量在夏季略有下降，但在 9 月份却有所回升，到 10 月份，访问量回升至 17 亿次。

AI清洁机器人可以在凌乱的卧室里整理衣服

[摘要]加州大学伯克利分校的肯·戈德堡及其团队开发了一种先进的机器人系统，AI清洁机器，一款带有摄像头和抓臂的机器人已经被开发出来，可以有效地捡起并整理凌乱的卧室里的成堆衣服。即有效地捡起散落在地上的衣物。这个任务对人类而言相对容易，但对机器人来说却是一个挑战，因为它涉及到确定衣物的边缘以及如何将它们组合在一起等复杂操作。这个系统能够一次捡起多件散落的衣服，有望帮助整理混乱的生活空间。

埃森哲收购了Ammagamma

[摘要]Ammagamma，一家总部位于意大利的专门从事人工智能解决方案的公司，收购金额未公开。后者将并入埃森哲欧洲人工智能高级中心。

AI女友产品Dolores项目复盘

[摘要]本文介绍了AI女友Dolores产品的概念、原理及其在现实生活中的应用。AI女友产品是一种基于人工智能技术的虚拟伴侣，能够通过语音识别、自然语言处理等技术与用户进行互动。目前，AI女友产品已经在一些领域取得了显著的进展，例如游戏、客服等，但同时也存在一些争议，如隐私保护、心理健康等方面的问题。未来，随着技术的不断发展和普及，AI女友产品有望成为人们日常生活的一部分。

谷歌在长视频理解方面的创新

[摘要]Google 的 Mirasol 3B 是一个用于处理音频、视频和文本数据的复杂系统。Mirasol 3B 在视频问答等任务中的表现优于其他模型，并且可以很好地处理长视频。

Covera Health 的 5000 万美元融资计划

[摘要]人工智能放射学绩效平台Covera Health已获得额外5000 万美元的 C 轮融资，并完成了对人工智能放射学质量保证公司 CoRead 的收购。Covera Health 总部位于纽约，利用人工智能和数据分析来提高放射学准确性并减少误诊。他们的放射学卓越中心平台引导患者找到高质量的放射学提供者，并与付款人合作促进基于价值的支付。CoRead 的收购将被整合到 Covera 的平台中，所得资金将用于扩大其支付者和提供商市场。该公司的目标是通过人工智能应用彻底改变医疗保健。

Stepsize使用 GenAI 报告产品开发

[摘要]Stepsize使用 GenAI 自动创建有关产品开发的令人惊叹的易于理解的更新。它与 Jira 或 Linear 等问题跟踪器集成，并智能分析您的项目数据，链接目标和活动以创建上下文丰富的冲刺和周期报告。

Pika Labs宣布筹资5500万美元并发布Pika 1.0：文本到视频生成器的革新升级

[摘要]AI视频初创公司Pika Labs近日宣布成功筹集5500万美元，并同时发布了其文本到视频生成器的新版本Pika 1.0。新版本被称为“想法到视频”平台，允许用户使用文本、图像或现有视频作为提示来创建AI生成的视频。平台的新功能包括编辑AI生成视频的能力，例如更换服装、改变风格，甚至调整视频的画布大小和长宽比。这些功能将从周一开始通过网络和Discord向用户提供。

Notion推出Q&A功能：数字领域的私人助理，提升生产力

[摘要]Notion最新推出的Q&A功能作为用户在数字领域的私人助理，旨在提升工作流程的效率。这一功能允许用户针对Notion工作区提出各种问题，如查询上周会议行动项、找到特定课堂笔记，或总结特定计划。通过即时知识访问，Notion Assistant助力用户实现无缝的生产力提升，通过提问和探索简化工作流程。

GPT-4 在塑造放射学未来方面的潜力

[摘要]Microsoft Research最近探讨了GPT-4在放射学领域的潜力，重点研究其在疾病诊断和处理中的应用。GPT-4已在医学能力测试和基准数据集中表现出色，对医疗咨询提供有希望的视角。研究包括对GPT-4处理放射学报告的综合评估，并采用了零样本、少样本和思维链提示技术。GPT-4在某些任务中展示了新的最先进性能，如结构化放射学报告，有助于标准化疾病描述。此外，GPT-4还可以将医疗报告翻译成更易于患者和医疗专业人员理解的格式，并在放射学专业人员日常工作中提供辅助。

亚马逊发布Amazon Q：个性化人工智能工作助手

[摘要]亚马逊最近进入了人工智能聊天机器人领域，推出了名为Amazon Q的生成式AI聊天机器人。这一举措标志着该公司与OpenAI的ChatGPT和Google的Bard等类似产品竞争。Amazon Q允许用户进行类似人类的交流，由亚马逊旗下的Amazon Web Services开发，并在拉斯维加斯举行的AWS re:Invent年度活动上公布。

Perplexity 推出实时 LLM API

[摘要]Perplexity 刚刚推出了首个向公众开放的在线 LLM API，其特点是使用互联网知识不断更新模型。pplx-7b-online 和 pplx-70b-online 机器人提取实时数据，目标是超越纯粹规模的有用性和准确性。

Together AI 筹集了 1.02 亿美元来推动开放人工智能

[摘要]初创公司 Together AI 帮助公司在昂贵的 GPU 上高效运行开源模型，刚刚宣布筹集 1.025 亿美元的巨额资金。这笔资金使该公司成为支持 OpenAI 等封闭巨头的替代品（讽刺的是）的潜在领导者。

OctoAI上1秒内生成高质量图像|OctoML

[摘要]最近，OctoAI在图像GenAI模型方面取得了两项重大进展，极大地提高了生成高质量图片的速度和成本。要开始使用OctoAI图像生成解决方案并亲自尝试，请立即注册并免费开始。第二个是LCM-LoRA，这是一项更新且更令人印象深刻的创新，使您能够在不到1秒的时间内获得高质量的图像输出，并以目前最低的SDXL图像价格获得图像输出

DeepMind 的人工智能彻底改变了材料发现

[摘要]谷歌 DeepMind 推出了一款突破性的人工智能工具 GNoME，改变了新材料的发现方式。这款深度学习工具已经预测了超过 220 万种新材料的结构，其中 700 多种是在实验室创建的用于测试。GNoME 的方法结合了两种深度学习模型来生成大量材料结构，从而显着加快了发现过程。

Perplexity Labs推出基于Mistral和LLaMa的高速联网大型语言模型

[摘要]Perplexity Labs最近发布了两个自主训练的大型语言模型：pplx-7b-online和pplx-70b-online。这两个模型分别基于Mistral-7B和LLaMa 2-70B开发，其最显著的特点是内置联网功能，提供了比GPT-4更快的响应速度。用户体验评估显示，这些模型的性能超越了ChatGPT-3.5，使它们成为目前未订阅GPT-4用户的理想选择。

微软将实时操作系统 ThreadX 开源并捐赠给 Eclipse 基金会

[摘要]微软宣布将其通过收购 Express Logic 获得的实时操作系统 ThreadX 开源，并已将其捐赠给 Eclipse 基金会。ThreadX，现被称为 Eclipse ThreadX，将在 MIT 许可证下提供。ThreadX 在许多设备上运行，包括 Intel 芯片的管理引擎和 Raspberry Pi。此操作系统的普及并不为人所知，但它在许多设备上都有应用，如 Raspberry Pi 和 NUC 电脑。2019 年，微软收购了 Express Logic，并将 ThreadX 更名为 Azure RTOS。

字节跳动成立新部门Flow，发力AI应用层

[摘要]2月，36氪曾报道，字节跳动大模型团队开始组建，分别在语言和图像两种模态上发力，由Tik Tok产品技术负责人朱文佳带队。

浪潮信息发布源2.0基础大模型，千亿参数全面开源

[摘要]算力方面，源2.0采用了非均匀流水并行的方法，综合运用流水线并行+优化器参数并行+数据并行的策略，让模型在流水并行各阶段的显存占用量分布更均衡，避免出现显存瓶颈导致的训练效率降低的问题，该方法显著降低了大模型对芯片间P2P带宽的需求，为硬件差异较大训练环境提供了一种高性能的训练方法。为了更高效地获得相对匮乏的高质量中文数学及代码数据集，源2.0采用了基于大模型的数据生产及过滤方法，在保证数据的多多样性的同时也在每一个类别上提升数据质量，获取了一批高质量的数学与代码预训练数据。

Stability AI 推出 SDXL Turbo：实时高效文本到图像生成模型

[摘要]Stability AI 最近推出了一款名为 SDXL Turbo 的先进文本到图像生成模型。该模型采用创新的蒸馏技术，能够在大幅减少计算量和生成时间的同时，从文本描述中快速生成高质量图像。通过将生成步骤数量从50个减少至仅1个，SDXL Turbo 实现了秒级和毫秒级别的图像输出，显著提高了推理速度。特别值得注意的是，在使用A100处理器时，该模型能够在仅207毫秒内生成512x512分辨率的图像。SDXL Turbo 目前可在 Clipdrop 网站上免费试用。在多个模型比较测试中，如与 StyleGAN-T++、OpenMUSE、IF-XL、LCM-XL等模型对比，SDXL Turbo 展示了其在图像质量和匹配度上的优势，尤其在盲测中表现卓越，超越了多步骤模型，同时保持了图像的高质量。这标志着在实时图像生成领域的一个重要进步。

RAGs：创新的聊天机器人定制技术，结合信息检索与文本生成

[摘要]本文介绍了RAGs（Retrieval-Augmented Generation）技术，这是一种允许用户通过自然语言创建和定制个性化聊天机器人的创新方法。RAGs机器人能够结合信息检索与文本生成技术，提供准确、信息丰富的答案，特别适用于需要处理复杂查询和专业信息的场景。用户无需具备编程技能，只需通过简单的自然语言描述和设置相关参数即可自定义机器人。此技术支持多种大型语言模型，包括OpenAI和Anthropic的模型，使机器人在处理语言任务时更为强大。RAGs的安装过程简单直观，易于操作，适合各类用户。它的灵活性和适应性使其成为客户服务、教育、研究辅助等多种领域的理想选择。

运用生成式AI改革专利工作流程：提升效率与质量的新策略

[摘要]本文探讨了生成式AI技术在专利工作中的应用，重点分析了它在专利撰写、申请、文档分析和无效论据构建等方面的作用。该技术可快速起草专利说明书，减少时间成本，同时提高文档的质量和一致性。在专利申请阶段，AI通过分析审查意见和现有技术，提出有效响应策略，指导战略论点制定。文档分析方面，AI能够迅速映射权利要求特征，准确定位功能披露或未披露部分，有效减轻了传统文档审查的负担。在无效论据构建阶段，AI通过集成的现有技术检索生成无效论据，加速分析过程，降低成本。

AI视频编辑器Pika 1.0发布，实现高质量文生视频、图生视频和局部修改视频功能

[摘要]这个11月AI视频领域真是卷的不行，在继runway发布了他们的局部动画笔刷，Stability AI 开源了他们的AI视频模型后，另一边的Pika终于发布了他们的视频编辑器，并同时公布了他们获得了5000W美元的投资。但是目前就pika的宣传片来看，pika的生成质量远高于runway，文生视频其实最大的问题在于动画生成的清晰和连贯性，在之前runway的生成里，只能在微小的动作上保证视频的稳定性性，一旦动作幅度增加就会产生不同程度的变形，但是目前pika宣传片上展示了十分连贯的动画。

Pika 宣布完成 5500 万美元 A 轮融资，投资背景非常豪华

[摘要]同时，创业仅 6 个月的 Pika 宣布完成 5500 万美元 A 轮融资，投资背景非常豪华，包括：Nat FriedmanDaniel GrossLightspeed Venture PartnersElad GilAdam D'AngeloAndrej KarpathyClem DelangeCraig KallmanAlex ChungAravind SrinivasVipul Ved PraakashMateusz StaniszewskiKeith PeirisZach还有 SV Angel、Homebrew、Conviction Capital、Ben's Bites 等风投机构。

2，监管与合规

运用生成式AI改革专利工作流程：提升效率与质量的新策略

[摘要]本文探讨了生成式AI技术在专利工作中的应用，重点分析了它在专利撰写、申请、文档分析和无效论据构建等方面的作用。该技术可快速起草专利说明书，减少时间成本，同时提高文档的质量和一致性。在专利申请阶段，AI通过分析审查意见和现有技术，提出有效响应策略，指导战略论点制定。文档分析方面，AI能够迅速映射权利要求特征，准确定位功能披露或未披露部分，有效减轻了传统文档审查的负担。在无效论据构建阶段，AI通过集成的现有技术检索生成无效论据，加速分析过程，降低成本。

研究揭露新型攻击可从ChatGPT提取训练数据

[摘要]DeepMind研究人员发现了一种名为“发散攻击”的新方法，能够诱导ChatGPT输出其训练数据的具体内容。此攻击仅需约200美元的token费用，即可提取数兆字节的训练数据，甚至包括真实的电子邮件地址和电话号码。该方法使模型输出训练数据的频率高于正常情况150倍，从而可能提取高达1GB的训练数据集。研究人员利用特定的重复命令提示，使模型倾向于回落到其预训练数据，而非遵循微调对齐程序

美国调查阿联酋人工智能强国是否可能与中国建立联系

[摘要]美国官员正在悄悄调查阿联酋主要人工智能公司 G42 与中国公司之间的潜在联系。由于 G42 最近宣布与 OpenAI、微软和戴尔建立合作伙伴关系，人们的担忧围绕着数据和技术转让的风险。中央情报局对 G42 的联系提出了警告，特别是与华为等公司的联系，这些公司可以成为向中国军方提供美国先进技术的渠道。随着人工智能成为塑造全球格局的关键角色，间谍活动和国家安全威胁的风险也随之增加。随着中美人工智能竞赛的持续加剧，这种情况值得关注。

Google 和 Symphony 的银行合规人工智能项目

[摘要]谷歌和科技公司 Symphony 正在合作增强银行和投资公司的语音分析能力。此次合作旨在满足通信合规性方面日益增长的监管要求，特别是在跟踪和记录语音和视频通话方面。利用 Google Cloud 的生成式 AI 平台 Vertex AI，Symphony 的 Cloud9 语音产品现在将具有先进的语音转文本和自然语言处理功能。

美国、英国和全球合作伙伴发布安全人工智能系统开发指南

[摘要]美国、英国和其他16个国家的国际合作伙伴发布了新的指南，旨在推动开发安全人工智能（AI）系统。这些指南强调了安全设计、透明度、问责制以及社会问题如偏见和隐私，同时鼓励漏洞赏金制度，以快速发现和修复潜在漏洞。该举措旨在提高人工智能系统的网络安全水平，打击对抗性攻击，以确保安全和可靠性成为AI开发的基本前提。

美国参议员们在一份声明中写道，大型科技公司“最终被迫承认自己在保护儿童方面的失败”

[摘要]Meta、TikTok、Snap、X 和 Discord 的首席执行官将在 1 月 31 日的美国参议院司法委员会听证会上回答有关儿童在线保护的问题。解决在线儿童性剥削问题的听证会原定于 12 月 6 日举行。

探索人工智能在日常生活中的应用与挑战：AI-ACT 和透明度政策的影响

[摘要]人工智能（AI）在医疗、提高任务效率和减少社会不平等方面发挥着重要作用，但也带来了复制偏见、误信息传播和潜在滥用等风险。针对这些挑战，欧盟的AI-ACT、美国白宫的AI权利法案和G7国家展示了政府的应对措施，特别是AI-ACT对AI系统根据伤害可能性分级并规定相应法规。AI ACT特别要求生成式AI系统（如大型语言模型LLM）提高透明度，确保输出被标识为AI产生，增加用户意识。然而，透明度作为避免人们伤害自己和他人的手段，其有效性存在疑问。研究显示，即使在透明度条件下，人们仍可能遵循不道德的AI建议。这表明透明度单独可能不足以预防AI输出导致的道德风险，需要更全面的措施。随着AI与人类互动日益增多，理解其在道德决策中的作用变得更为关键。

“分享每周阅读的有价值的资讯，重点关注人工智能技术应用案例、AI产品化、信息技术、推荐、搜索、社交媒体，电商交易、新技术（区块链、加密货币等...）的技术伦理和体验创新。”该简报使用阅粒搜藏（yueli.com）+chatGPT生成。“

		自动登录	找回密码
密码			立即注册

AI及信息技术应用2023年12月3日简报

相关帖子