大模型资讯:
文心一言APP上架iOS平台,方便多平台用户使用
据 App Store 页面显示,百度的文心一言APP 现已上架iOS平台,用户可以免费下载。
文心一言 APP 向用户提供一对一的对话式聊天场景,能够与人对话互动,回答问题,协助创作,同时在文字创作、商业文案创作、数理逻辑推算、多模态生成等多个应用场景中为用户提供帮助。
此前在今年4月,百度便向安卓用户免费开放内测专用APP。
汤姆猫与西湖心辰团队已在联合推进人工智能交互产品研发工作
据界面新闻报道,汤姆猫近日表示,对西湖心辰进行了战略投资,目前公司是西湖心辰团队之外的最大外部股东。
在人工智能产品研发上,公司与西湖心辰团队结合“会说话的汤姆猫”IP 形象,已在联合推进人工智能交互产品的研发工作。借助西湖心辰在人工智能领域积累的经验,公司与西湖心辰将持续推进在多模态模型、通用人工智能垂直领域模型及终端软硬件等交互产品领域开展深度合作,将“会说话的汤姆猫”升级迭代成有记忆、有情感、能主动聊天的汤姆猫。
双方还将把汤姆猫 IP 的应用场景从游戏移动应用拓展至教育、智能硬件、智能家庭等场景。
Humane 公布首款 AI 穿戴设备,预计年内上市
据 TechCrunch 报道,由两名前苹果员工成立的初创公司 Humane 近期公布旗下首款 AI 产品 Humane Ai Pin。
据悉,Humane Ai Pin 是一款具备投影显示和人工智能功能的可穿戴设备,可实现智能联网。不过其具体外观和功能目前尚未公开。
Humane Ai Pin 计划在今年之内上市。
润和软件发布人工智能中枢平台AIRUNS公测版本
据润和软件官方消息,润和软件今日发布人工智能中枢平台公测版本AIRUNS。
AIRUNS将为业内探索人工智能技术发展与行业应用提供重要参考。润和软件将基于AIRUNS不断推动AI应用落地,为各行业激发创新潜力并带来更多的发展机遇。
AIRUNS集成了先进的主动学习方法、高级数据和模型版本控制,同时引入创新的工作空间概念,使得多个任务特定数据集的并行快速迭代成为可能。此外,AIRUNS还提供开放的API,可轻松集成第三方工具。
Snap 联手高校公布3D生成模型 magic123
Snap 近日联合阿卜杜拉国王科技大学以及来自牛津大学的研究者共同公布了一款 Magic123 的大模型产品,可将2D图片转换为3D建模。
Magic123 会在第一阶段生成粗略的几何形状,并在第二阶段生成具备高分辨率的网格模型。
实验显示, Magic123 的效果比此前的图像生成 3D 技术有着明显地改进。
midjourney 发布新功能 weird,生成诡异风图片
midjourney 官方近日宣布,他们已对midjourney 进行了更新,增加更多新功能。
其中最值得关注的是 weird 功能,用户可以利用该功能生成更风格加诡异的图片。该功能提供0-3000的不同参数,数值越大,生成的图片就越诡异。
此外,还有全新的 Turbo 模式,他允许用户花费2倍的价格来用4倍的速度来生成图片,此外还有新的mega会员计划。
天眼查联合华为云发布全球首个商查大模型:“天眼妹”可信商业助理
天眼查近日与华为云联合发布了全球首个商查大模型——"天眼妹"可信商业助理。
据了解,该产品利用了华为云先进的智能大模型技术,结合天眼查海量商业公开数据,为用户提供准确的商业信息。"天眼妹"可信商业助理以拟人化的交互形式和友好的界面面向用户,是业界首个基于"可信数据+可信算法"的面向个人端的可控大模型数字产品。在2023全球数字经济大会人工智能高峰论坛上,"天眼妹"被授予了"北京市通用人工智能大模型行业应用典型场景案例"称号。
该产品发布标志着天眼查和华为云在推动大模型在企业服务领域的落地与应用方面取得重要进展。据悉,该产品已经完成内部测试,预计7月底对用户开放邀请试用。
中国电信公布 TeleChat 大模型
中国电信集团数字智能科技分公司副总经理张鑫近日公布中国电信版 ChatGPT 产品 TeleChat 大模型。
据介绍,该模型支持输出代码、写演讲稿等,其公司研发目标是成为“百亿级 AI 服务商”,产品涵盖 AI 算法、平台、应用、硬件、大模型等,其他信息暂时没有公布。
中国电信表示,面向未来,中国电信将进一步学习借鉴ChatGPT技术,用生成式AI技术为实体经济服务,通过加强与产、学、研、用等各界合作,加快推进数字中国建设,助力数字时代的中国式现代化。
李开复筹组新公司首度对外亮相
据36氪报道,创新工场董事长兼CEO李开复筹组新公司首度对外亮相,定名零一万物。官网(01.AI)同步上线 。
据介绍,零一万物总部注册于北京,目前团队已经有数十名核心成员。已加入的联创团队成员包括前阿里巴巴副总裁、前百度副总裁、前滴滴/百度首席算法负责人等,算法和产品团队背景均来自国内外大厂,同时启动2023 DeeCamp AI人才项目。
今年3月,李开复在朋友圈表示筹办新公司 Project AI 2.0,目标是大模型领域。李开复认为,AI 2.0不仅是个聊天工具,也不仅是个图文创作的 AIGC 生成, Co-pilot 和如今看到的应用都还只是 AI 2.0 能力的开端。
腾讯与西湖大学共同申请问答模型专利,可使问答语句更准确连贯
国家知识产权局网站披露,6月30日,腾讯科技(深圳)有限公司与西湖大学共同申请的“语句生成方法、装置以及计算机可读存储介质”专利公布。
摘要显示,该专利实施方法包括:当获取到目标问答语句时,获取该目标问答语句的历史语句。将目标问答语句和历史语句输入对话模型,并获取输出的多个候选响应语句。将候选响应语句输入语句连贯性分类模型,基于该模型获取各个候选响应语句与历史语句的连贯性分值。基于该分值从多个候选响应语句中确定出目标问答语句的目标响应语句。采用该申请,可以提高问答语句中的目标响应语句的生成准确性、连贯性,语句生成效率高,适用性强。
金山办公宣布与英伟达团队合作,加速 WPS AI 服务
金山办公官方公众号今日发文宣布与英伟达团队合作,加速 WPS AI 服务。
据介绍,金山办公与英伟达团队合作,通过英伟达 Tensor Core GPU、TensorRT 提升图像文档识别与理解的推理效率;借助英伟达 Triton 推理服务器的部署,成功优化 GPU 利用率,提供高推理吞吐量。相比于 CPU 其 pipeline 耗时共下降 84%;采用英伟达 Triton 推理服务器部署,其部署成本节省了 23%。
百度沈抖:大模型将改变所有行业
近日,河北省人大常委会邀请百度集团执行副总裁、百度智能云事业群总裁沈抖作《大模型:产业智能化的新引擎》专题讲座。沈抖表示:“大模型的出现,重新定义了人机交互。未来,人们只需要用自然语言提出需求,大模型就可以自己理解需求、再生成内容、升级工具,最后提供服务。学术界、产业界都认为,第四次科技革命已经到来。”
重点论文:
视觉语言模型零样本识别的挑战:粒度和正确性
本论文探讨在开放世界环境下应用视觉语言模型 (VLMs) 进行零样本视觉识别任务所面临的挑战,重点是比较视觉语言模型 (如 CLIP)。首先对不同粒度水平的概念的性能进行了检验。提出了在两个实验设置下公平评估性能差异的方法,并发现 VLMs 更擅长识别细粒度概念。此外,团队发现 VLM 相似度得分并不严格反映给定视觉输入的文字输入的正确性。提出了一个评估协议来测试我们的假设,即得分可能会偏向更有用的描述,并且嵌入之间的相似度得分的特性使得 VLMs 难以识别相似但不正确的描述之间的正确性。该论文的研究突出了使用 VLMs 在开世界环境下所面临的挑战,并提出了提高其零样本能力的未来研究方向。
论文地址:https://arxiv.org/abs/2306.16048
原创文章,作者:,如若转载,请注明出处:https://knewsmart.com/archives/169772