您现在的位置是:首页 > 人工智能 >
总编访谈 印象笔记的AI征途
2024-09-06 17:39:01作者:郦雨婷来源:中国信息化周报
摘要时 间 2024年8月6日地 址 北京朝阳区中海广场中楼印象笔记科技有限公司会议室访谈人 印象笔记高级副总裁 乔迁 中国信息 ...
时 间 2024年8月6日
地 址 北京朝阳区中海广场中楼印象笔记科技有限公司会议室
(本文不涉密)
责任编辑:郦雨婷
地 址 北京朝阳区中海广场中楼印象笔记科技有限公司会议室
访谈人 印象笔记高级副总裁 乔迁
中国信息化周报副总编 刘晶
截至今年3月,中国共有独角兽企业369家,超过全球独角兽企业数量的1/4,位居全球第二。这是在今年4月全球独角兽企业大会上发布的《中国独角兽企业发展报告(2024年)》中的数据。AI领域的独角兽,因处于“风口”而备受关注。作为上榜企业,印象笔记以其独特的“AI+知识管理”吸引了我们的目光。随着“人工智能+”的发展,仅有AI发展三要素:算力、算法、算据已经不能满足需要,知识图谱作为第四要素,成为“人工智能+”爆发的重要一环。
印象笔记能够凭借“知识管理”在AI风口起飞吗?为了追寻答案,我们走进了这家独角兽公司。
对非结构化的知识数据进行管理
刘晶:2012年5月,美国硅谷公司Evernote在中国推出“印象笔记”服务。2018年6月,印象笔记在中国独立运营,成为一家由中国资本推动、中国本地团队管理运营的中美合资公司。独立运营6年的印象笔记,现在已经发展为中国AI领域的“独角兽企业”,印象笔记为什么能够成为一家“小巨人”企业?
乔迁:我们将产品定位于知识管理领域的工具软件,我们所做的事情是帮助用户把自己的数据通过组织、整理,形成自己的信息;然后对这些信息再提炼,形成知识。这是一个从数据到信息再到知识的过程,在这个过程中,体现出“Code”概念,即Capture(捕获)、Organize(组织)、 Distill(提取) 和Express(表达)。在这个基础上,用户可以跟别人进行分享、协作,形成对知识进行管理的完整循环。
印象笔记对AI的投入,是比较早的。一方面,印象笔记符合人工智能发展赛道要求,因为印象笔记一直在处理非结构化信息,包括文字、音频、视频、图片等,这些非结构化数据很难以一个严格的数据库形式来管理,而印象笔记从 2012 年进入中国开始,就一直致力于帮助用户进行非结构化数据的收集与整理。
另一方面,印象笔记很早就开始做战略布局,我们在 2018 年成立了自己的人工智能研究院,整个研发团队既被 AI 赋能又为 AI 赋能。我们已经结合自然语言处理和印象笔记本身的一些功能进行了尝试,比如笔记的智能摘要功能,以及自动打标签的功能等。在2023年4 月份左右,我们又在产品内提供了AI和印象大模型的相关功能。
刘晶:喜欢用印象笔记来做知识管理的主要是哪些用户?
乔迁:我们将印象笔记用户定义为知识工作者,包括媒体从业人士、医生、律师等,这些人对信息的获取、整理有较大诉求。一般来说,印象笔记会陪伴这些用户很长时间,从学生开始,到他们毕业、工作、成为团队负责人。我们的用户主体往往会持续使用印象笔记的产品。
另外,从企业角度来说,一些知识驱动型的企业团队也是我们的用户主体,像律师事务所、VC投资(风险投资)机构,还有制造业设计中心、研发中心等,他们的共性需要是对大量信息进行收集和整理,以及团队之间需要高频次地同步和共享内容信息与知识。
AI在知识管理中如何发挥作用
刘晶:在今年2024世界人工智能大会上,印象笔记提出想做超级应用,具体来看,印象笔记将从哪些方面去达成这个目标?
乔迁:印象笔记有一个思路,也是我们自己提出的一个概念,是在复合AI系统之下,打造超级应用的六要素,分别是模型、数据、用户、场景、交互和载体。
首先,我们会考虑模型本身的能力,印象笔记的模型更多集中在“文生文”领域,同时,我们的模型也具有一定的路由能力,当用户有“文生图”或“文生视频”的需求时,我们可以请求别的模型产出一些满足用户需求的结果。
第二,从数据维度来看,我们会思考一些问题:当模型训练的时候,我们用什么样的数据去进行训练?它有没有自己的独特性?在知识管理垂直领域里,如何用高价值的知识类的语料去进行模型训练?思考这些问题能帮我们将目标厘清。
第三,从用户的角度来看,用户能通过我们的AI产品去解决什么样的问题?我们的回答往往会聚焦在三个点上:创作辅助、阅读辅助、通过AI助手实现用户与笔记对话。
第四,从交互维度来看,我们认为对话式交互不一定是最好的交互方式。用户在笔记里写下一段话,这其实是 in context (上下文式)交互,在这个场景下,它比对话式交互更好的原因是更符合用户当时的创作场景。
第五,从场景维度来看,我们会考虑用户想要使用 AI 解决什么样问题?印象笔记的模型不擅长写代码,但它“读书”能力很强,或者说它能更好地抓取知识要点,从而形成总结,这是我们的优势。
最后,我们还会考虑载体。载体究竟是落在独立应用上,还是落在现有的APP 上?在微信公众号上能否实现?在智能硬件上能否实现?
我们认为,如果一个大模型只提供一个人机对话的界面,是不能被称为超级应用的。所以将六要素的思考全都整合在一起,才能打造出一个为用户提供更好服务的 AI 应用。
更重要的是,无论是做超级应用或是其他,都要和公司本身的定位相结合。如果让印象笔记去做一个像 Sora的生成视频大模型应用,就非常不现实,因为这和我们推崇的六要素不适配。但在知识领域、知识管理领域,如何把 AI 和应用更好地结合起来,一定是我们未来持续深耕和发展的方向。
刘晶:AI+知识管理的未来机会在哪里?
乔迁:如果说过去一年是云端大模型的爆发年,那么今年则是AI 应用的爆发年、端侧大模型能力的爆发年。对我们来说,端侧模型怎么样和用户设备上的数据更好地结合和打通是一个问题。因为用户其实还有很多知识存储在本地电脑硬盘里,那这些东西怎么抽象出来、形成知识?是我们需要进一步探讨的问题。
另一个机会,就是 AI 的智能硬件。AI 的智能硬件未来可能不是在手机端或是PC 端,往大了讲,可能是具身智能。
印象笔记目前已经做了一系列的硬件,这些硬件都在解决一些传统信息记录场景上电子化的问题。在原来的传统领域里,信息可能分散在不同的地方,它可能是一条语音、一段录音,可能是在笔记本上写的一些字,书上被高亮的一个段落。基于这些传统信息场景,我们推出了印象智能笔(EverPEN)、印象录音笔(EverREC)、印象电子马克笔(EverMARKER)等硬件产品。其中,印象智能笔在智能硬件领域里,已经做到了行业第一。
用户通过这些产品进行书写文字、录音、选中并高亮书籍中文段内容,随后,这些信息会被同步到印象笔记里,完成电子化。电子化的好处是方便用户后期进行整理、检索,形成自己的知识体系。
我们认为,未来 AI 大模型可以更好地赋能信息记录。以录音笔为例,用户不需要把某个录音全部转录,一点一点地查找重要信息,而是可以用大模型自动形成摘要和重点,这将大大提高使用者的工作效率。
希望成为“更智能的第二大脑”
刘晶:好的思想最终需要体现在产品设计上,印象笔记在产品上做了哪些创新?对产品的定位是什么?
乔迁:从去年开始,我们就希望印象笔记通过 AI 的赋能,由我们原来的定位“第二大脑”,变成现在我们所希望的“更智能的第二大脑”。
举个例子,我们在聊一个概念:让时间看得见。我们希望笔记内容可以以一个日程或日历的形式展现出来,这样可以让用户更方便地查找过去一段时间里,或是特殊时间点记录下的笔记内容。就好像笔记见证了用户的进步和成长,这是我们希望能给用户带来的一种体验。而我们发现,该功能的使用率在“日历”功能推出后有了翻番的提升,可见这是一个用户乐于看到的,将知识与行动串联起来的功能。
刘晶:从AI应用来看,由高质量的数据训练出来的模型,才是真正具备价值的。在数据的管理、应用、挖掘方面,印象笔记有什么规划?
乔迁:首先,印象笔记始终秉持“信息是属于每个用户个人的宝贵的数字知识资产”的原则。其次,我们不会使用用户的笔记或数据去训练大模型,我们用的都是公开数据。同时,我们也会鼓励用户进行主动分享。例如,我们会在产品内提供协作的能力,用户会有一个共享空间,在这个共享空间里,用户可以与同一个项目组的同事共享各自收集到的资料和信息。
另外,我们的大模型在训练时,一方面用公开的数据源;另一方面,用印象笔记的独特数据。印象笔记的独特数据包括几个方面:第一,我们有一个强大的功能叫作剪藏,就是当用户无论是在微信、微博、小红书,还是在网页上看到一些他认为感兴趣的内容,都可以通过剪藏这个功能,将其保存到印象笔记中。这些数据是由用户通过API接口保存而来的,属于公开数据。第二,印象笔记还有一个内容平台,叫作“识堂”。在这个平台内,用户可以基于他的笔记与别人共享、发布,形成公开的数据和内容。最终,印象笔记将这些内容与市场公开数据相结合,形成我们独有的高价值数据集。
刘晶:大家在用印象笔记产品的时候,会遇到一些付费服务。目前印象笔记在扩大用户总量、提高服务收入之间,如何做到平衡?
乔迁:印象笔记从一开始就是订阅制的模式,所谓订阅制就是会员制。所有的用户能免费使用印象笔记,但我们一些高级功能是需要付费的,也就是所谓的“免费使用、功能付费”的概念。
我们既希望获取更多的用户,同时公司本身的商业持续发展也需要商业收入,所以,付费订阅制能在两边做到一个较好的平衡。
印象笔记已经不是之前的互联网流量模式(互联网流量模式指的是平台通过砸钱获得大量流量,再通过广告的方式转卖出去)。我们希望我们的产品能为用户提供更多的增值,所以我们更希望它是一个PLG 的模式(Product-Led Growth,用产品推动用户增长)。
刘晶:你认为,可以支持印象笔记长期发展的核心理念是什么?目前印象笔记在专注构建的竞争优势是什么?
乔迁:我觉得首先是专注。
我们在知识管理的领域里持续深耕了12 年,这些积累和经验带来的“壁垒优势”是稳定。对于笔记类用户来说,他们需要的是“我随时随地能够访问我的笔记,并找到我想要的内容和知识”,这一直是用户的最核心诉求,所以我们的第一要务是保证为用户提供稳定持续的服务。
而另外一个,就是离线能力。离线能力指的是用户的所有笔记内容,无论是在 PC 端还是移动端都可以随时进行离线访问。我们的目标是当用户乘坐飞机或高铁时,即使遇到网络或信号差的情况,也能获取到自己的数据和信息。所以我们一直坚持“云端、本地双备份”。
印象笔记倡导“端云一体”的概念,指的是在一些场景下,一些需要完成的任务由端侧去完成。我们有一个2.2B的模型,在 AI PC 上完全跑得起来。虽然端模型是小模型,无法执行一些复杂的推理,但端模型可以在离线的情况下实现一系列AI的能力,也就是我们之前提到的离线能力。我们能够实现的是端侧数据加端侧模型,这能够满足用户大部分场景下的使用需求。
(本文不涉密)
责任编辑:郦雨婷