0931-8276785
13965522023
这家名为FieldAI的公司,开发“实地基础模型”(FieldFoundationModels,FFMs),整合文本、图像、语音和激光雷达传感器数据,可以支
这家名为Field AI的公司,开发“实地基础模型”(Field Foundation Models,FFMs),整合文本、图像、语音和激光雷达传感器数据,可以支持机器人处理非结构化、未绘制地图的环境,不依赖先前的模型、GPS或人工干预。
近日,外媒报道称,Field AI正在商谈以20亿美元的估值筹集数亿美元资金,这一估值较去年夏天投资者对其5亿美元的估值高出四倍。在那一次融资中,包括Khosla Ventures、淡马锡以及NVIDIA向它投资了超过1亿美元。
Field AI本质是一家软件公司,它的模型可以通过一个外部硬件单元运行,该单元可附着在Boston Dynamics和Unitree Robotics(宇树)等公司生产的机器人上,让这些机器人拥有更强大的环境适应性和通用机器智能。
对于下一代的AI是什么,NVIDIA的CEO黄仁勋表示:“下一代AI需要基于物理世界,如今的大多数AI并不理解物理定律。为了生成图像、视频、3D图形及许多物理现象,我们需要基于物理定律并理解这些定律的AI。”这个观点也与“AI教母”李飞飞不谋而合。
在机器人行业中,传统机器人技术对于一些简单的任务,例如“拿起罐子,拧紧罐子的盖子”,也需要多台机器分别编程来取罐子、放置盖子并拧紧。如果盖子、罐子或放置位置出现问题,机器人可能无法完成任务。
在具身智能时代,人们用自然语言而非代码直接告诉一台机器人拧上罐子盖。它就会理解这一指令,通过观察人类、视频或其他机器人自学如何拧盖子,然后完成任务——并对用户提出的其他请求重复这一过程。
Field AI打造的“实地基础模型”(Field Foundation Models,FFMs),其独特的地方就在“Field”(实地),这个模型能支持机器人处理非结构化、未绘制地图的环境,不依赖先前的模型、GPS或人工干预。
所谓非结构化环境,例如矿井、自然洞穴和城市地下空间,这些都对机器人(甚至人类)极具导航挑战性。这些非结构化环境,尤其是建筑环境中的另一难点在于,情况在不断变化,地面上的建筑材料、脚手架、叉车和重型机械四处移动,毫无可预测性。这对传统的,依赖静态地图的机器人来说是个大问题。
Field AI的FFM模型,可以帮助机器人在没有预先地图指引的情况下完成这些任务。没有漫长的设置过程,无需人工监督,机器人还能适应变化和新环境。
FFM模型整合文本、图像、语音和激光雷达传感器数据,它能够帮助机器人理解如何在世界中移动,而不仅仅是移动到哪里。
打造具身智能基础模型,主要挑战在于如何获取足够的真实物理世界数据,与大语言模型不同,物理世界没有互联网。Field AI的做法是与它的付费客户合作,在全球的工业和建筑工地收集这些数据。Field AI只需要让机器人在真实环境中自己运转,就能解锁许多客户甚至未曾考虑过的使用场景,逐渐解决corner case问题。
除了建造这一真实物理世界的数据飞轮,Field AI还与NVIDIA合作,它们使用机器人学习的仿真框架NVIDIA Isaac Lab来生成合成数据,运行数千个并行环境实例,每个实例配置不同的任务目标,这有助于进一步提升FFM模型的泛化能力。在这个过程中,Field AI也可以利用Isaac Lab的强化学习功能高效训练稳健且适应性强的运动策略。
Field AI的模型,其核心的优势在于泛用性和兼容性。它的使用场景不仅限于建筑、安全检查或其他已有的自动化机器人系统所在的领域,还包括测绘,石油勘探,工业制造,采矿,农业等更丰富的场景。
而且它几乎能够适应任何机器人硬件形态,例如四足机器人、人形机器人、自动驾驶出租车、飞行汽车等。
Field AI的模型可以通过一个外部硬件单元运行,该单元可附着在Boston Dynamics和Unitree Robotics(宇树)等公司生产的机器人上,让这些机器人拥有更强大的环境适应性和通用机器智能。
Field AI的创始人Ali Agha表示,通过控制完整的软件堆栈,将移动性与高级规划、决策和任务执行相结合,利用相对廉价的机器人将是Field AI商业成功的关键差异所在。
目前,Field AI已经获得了各个行业的商业客户,它的商业模式就是出售其专业AI模型的访问权限,很类似OpenAI售卖基础模型,已经实现数百万美元的收入。
无论是中国还是美国,具身智能与生成式AI一样成为最热的创业和投资赛道。仅从2024年开始看,就有Physical Intelligence获得了杰夫·贝索斯、Lux Capital和Thrive Capital领投的4亿美元融资,估值20亿美元;Figure AI在2025年2月启动C轮融资,计划募集10亿至20亿美元,投后估值将达到400亿美元;软银正计划向Skild AI投资5亿美元,使它的估值从A轮的15亿美元提升到40亿美元。
可以看到,获得巨额融资的公司主要集中在具身智能基础模型领域,也就是机器人的大脑。虽然在机器人领域,小脑,灵巧手等也都很重要,但大脑才是关键,才能泛化,才能为机器人提供通用性,让他们完成各种不同的复杂任务。
和大语言模型一样,具身智能基础模型的智能也来自于数据,但正如前文所述,具身智能基础模型主要挑战是,很难像大语言模型一样获得互联网规模的数据。
目前在具身智能行业有两种主流方式来解决这类问题,一种是让一定数量的机器人在现实世界中以成本效益高的方式收集数据,形成一个飞轮效应;另一种是仿真的方式来合成数据。
对于中国的创业者,在数据问题应该相对具有优势,中国具有庞大的市场,机器人也已经进入了上百个细分行业,尤其是工业领域和服务领域;这样一方面表明机器人在细分场景的高渗透率,另一方面会产生丰富的实际数据。
和AI的逻辑一样,具身智能的关键在应用。当有了高质量的通用“大脑”和“小脑”后,结合中国的机器人供应链优势,创业者可以相对低成本,低摩擦地在各个细分领域找到机器人的最佳形态和最佳应用方式。
阿尔法公社已经在具身智能的数据和应用领域有所布局,我们也希望发现更多具身智能领域的非凡创业者,希望帮助下一个世界级的机器人公司发展壮大。米乐M6 米乐M6官方网站
Copyright © 2024 米乐机电产品有限公司 版权所有 备案号:陇ICP备20001439号 网站地图