目 录CONTENT

文章目录

前谷歌员工成立初创公司InfiniMind,旨在构建基础设施以帮助企业理解其海量视频数据

Administrator
2026-02-10 / 0 评论 / 0 点赞 / 0 阅读 / 0 字

📢 转载信息

原文链接:https://techcrunch.com/2026/02/09/ex-googlers-are-building-infrastructure-to-help-companies-understand-their-video-data/

原文作者:Kate Park


企业正在生成比以往任何时候都多的视频内容。从多年的广播档案、成千上万的商店摄像头录像,到无数小时的制作素材,其中大部分只是未经使用地存储在服务器上,未被观看也未被分析。这就是暗数据:公司自动收集的大量未开发资源,但几乎从未以有意义的方式使用它们。

为了解决这个问题,CEO Aza Kai和COO Hiraku Yanagita(两位前谷歌员工,曾在谷歌日本共事近十年)决定构建自己的解决方案。他们共同创立了总部位于东京的初创公司InfiniMind,该公司正在开发基础设施,将PB级的未观看视频和音频转换为结构化、可查询的业务数据

“我的联合创始人曾在谷歌日本领导品牌和数据解决方案长达十年,我和他还在谷歌时就预见到了这个拐点,”Kai说道。他补充说,到2024年,技术已经成熟,市场需求也变得足够清晰,促使两位联合创始人下定决心自己创办公司。

Kai曾先后在谷歌日本从事云、机器学习、广告系统和视频推荐模型方面的工作,之后领导数据科学团队。他解释说,目前的解决方案要求用户做出取舍。早期的解决方案可以标记单个视频帧中的物体,但它们无法追踪叙事、理解因果关系,或回答关于视频内容的复杂问题。对于拥有数十年广播档案和PB级素材的客户来说,即使是关于其内容的基本问题也常常得不到解答。

真正改变的是2021年至2023年间视觉语言模型取得的进展。Kai指出,那时视频AI才开始超越简单的物体标记。过去十年中,GPU成本的下降和每年约15%至20%的性能提升有所帮助,但他告诉TechCrunch,更重要的故事是能力——直到最近,模型才真正能够胜任这项工作。

InfiniMind最近获得了580万美元的种子轮融资,由UTEC领投,CX2、Headline Asia、Chiba Dojo以及来自a16z Scout的一位AI研究员跟投。该公司正将其总部迁往美国,同时继续在​​日本运营办事处。日本提供了完美的试验场:强大的硬件、优秀的人才和支持性的初创生态系统,使团队能够在面向全球市场之前,与要求严苛的客户一起微调其技术。

其首款产品TV Pulse于2025年4月在日本推出。这款AI驱动的平台实时分析电视频内容,帮助媒体和零售公司“跟踪产品曝光、品牌形象、客户情绪和公关影响”,据该公司介绍。在与主要广播公司和广告公司的试点项目之后,它已经拥有了包括批发商和媒体公司在内的付费客户。

Techcrunch event

TechCrunch Founder Summit 2026: 门票开售

2026年6月23日,在波士顿,超过1,100位创始人将齐聚TechCrunch Founder Summit 2026,共同度过专注于增长、执行和实际规模化的一天。向塑造过行业的发展者和投资者学习。与正处于相似增长阶段的同行建立联系。满载可立即应用的策略而归。

购买门票可节省高达300美元,或四人及以上团队票可享受高达30%的折扣。

TechCrunch Founder Summit: 门票开售

2026年6月23日,在波士顿,超过1,100位创始人将齐聚TechCrunch Founder Summit 2026,共同度过专注于增长、执行和实际规模化的一天。向塑造过行业的发展者和投资者学习。与正处于相似增长阶段的同行建立联系。满载可立即应用的策略而归。

购买门票可节省高达300美元,或四人及以上团队票可享受高达30%的折扣。

波士顿, MA | 2026年6月23日

现在,InfiniMind已准备好进军国际市场。Kai表示,其旗舰产品DeepFrame,一个能够处理200小时素材以精确定位特定场景、说话者或事件的长篇视频智能平台,计划于2026年3月进行Beta发布,并于4月全面推出。

图片来源:infinimind

视频分析领域竞争激烈。Kai指出,像TwelveLabs这样的公司为包括消费者、专业用户和企业在内的广泛用户提供通用视频理解API,而InfiniMind则专注于企业用例,包括监控、安全以及分析视频内容以获取更深入的见解。

“我们的解决方案无需代码;客户带来他们的数据,我们的系统进行处理,并提供可操作的见解,”Kai说道。“我们整合了音频、声音和语音理解,而不仅仅是视觉内容。我们的系统可以处理无限长度的视频,而成本效益是一个主要的区别因素。大多数现有解决方案优先考虑准确性或特定用例,但未能解决成本挑战。”

这笔种子资金将帮助团队继续开发DeepFrame模型,扩展工程基础设施,招聘更多工程师,并在日本和美国接触更多客户。

“这是一个令人兴奋的领域,是通往AGI的路径之一,”Kai说。“理解通用视频智能就是理解现实。工业应用固然重要,但我们的最终目标是推动技术边界,以更好地理解现实并帮助人类做出更明智的决策。”




🚀 想要体验更好更全面的AI调用?

欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。

0

评论区