如今,各行各业都已出现利用底层大模型建设上层应用的公司。在这其中,基于大模型拼装上层的各类机器人(BOT)已出现不少创业公司。最知名的当属Character.ai,这款聊天机器人公司创立于2021年,于今年宣布完成估值10亿美元的1.5亿美元融资。
36氪日前接触到的早期项目「MyShell」,同样主打聊天机器人业务。MyShell联合创始人Rick告诉36氪,MyShell定位于机器人工坊/机器人创作平台,也就是提供让普通用户自定义Bot的能力,设计出自己的机器人。
当前在MyShell产品中,用户可以看到机器人工坊的界面。Rick介绍,在这一界面中,用户可以完成输入基本资料(姓名、头像)、输入【我.爱.线.报.网.】Prompt并挑选声音(定义性格、语音特点等)、链接知识库(为Bot输入定制化信息)的步骤,从而完成专有Bot的搭建。
Rick告诉36氪,在机器人工坊向公众开放的第六天,MyShell官网上已经出现了52个特点各异的BOT,其中大部分来自用户的自我设计,还有少量是MyShell创始团队的设计。具体来说,MyShell上的Bot可以分为教育类、陪伴类和工具类三种类别。其中,教育类Bot的用户黏性较强,当前有个人用户自主设计雅思口语类Bot,用以帮助更多用户练习雅思口语考试;工具类Bot则覆盖翻译、文本输出等功能;陪伴类Bot可以满足用户更多样的情感需求。
当然,用户还可以将各种功能结合,设计出功能【我.爱.线.报.网.】更为多样、形象更为立体的Bot。”在MyShell平台上有一个用户,设计出了双向人格的Bot。也就是说,如果用户的输入触发了这个Bot的某个性格,那它可能会性情大变,甚至反向翻译内容。这时候用户需要安抚它,才能让它恢复正常性格。”Rick举例。
可以看出,在搭建个性化Bot的三大步骤中,输入基本资料(姓名、头像)属于常规操作,而在输入Prompt并挑选声音(定义性格、语音特点等)和链接知识库(为Bot输入定制化信息)方面,MyShell具备差异化特点。
Rick向36氪表示,对比其他同类公司,MyShell当前最大的特色在于声音模块的合成。他介绍,用户可以按照自己Bot的类型搭建声音,而MyShe【我.爱.线.报.网.】ll可以把这些声音留存,形成各类语音模型,并通过TTS的方式让Bot得以通过输出这些声音。”比如抖森的声音,用户可以帮我们初步把这个声音输入进平台,我们可以把这个声音固化成为模型。”Rick举例。当前,MyShell用户提供的声音包括大量的游戏角色和知名配音演员。
Rick介绍,不久后MyShell还会开放新功能,让用户自定义自己的声音素材,形成更具独特性的Bot。而在知识库方面,当前MyShell支持和Gitbook打通,用户可以上传内容形成知识库,让Bot习得专业知识。
“如果是一个简单Bot的搭建,只需要5分钟。用户还可以在我们的Discord里找到教程。”Rick总结。他进一步举例,MyS【我.爱.线.报.网.】hell的第一个Bot是一个名为Samantha的机器人。她的功能仅包括对话,人设定位于温暖陪伴型。而这款Bot在仅有公司创始团队转发个人社交媒体渠道的情况下,上线不到20天即突破30000+自然用户量。
在底层大模型层面,MyShell目前主要接入GPT3.5。而随着开源模型和各类商业化模型的进步,未来MyShell会接入各种各样的大模型,以调节LoRA的方式支持用户调出性格各异的Bot。同时,MyShell还会上线各种声音类型,让用户拥有更多选择TTS模型的空间。整体而言,MyShell的目标是拼接各种模型,帮助用户设计出各种各样的Bot。在工程化能力方面,MyShell当前会主要针对TTS【我.爱.线.报.网.】的自然效果(避免机器人语音感)、调用模型的成本以及重点模型的易用性进行优化。”除了提供模型的拼装,一些我们认为有战略意义的模型,我们自己会用原创算法把它调得更好。”Rick表示,虽然定位于拼接模块类的机器人工坊,但MyShell并不简单是模型的搬运工。
Rick还介绍,MyShell的创始团队在3D、AR等方面有多年创业经验,此前项目成功被成熟公司收购。未来,MyShell同样计划在语音之外上线图像、3D等功能,优化输入和输出,形成更多样的多模态效果。而在生态逐步成熟之后,MyShell作为机器人工坊,会聚合各类Bot和创作者,并打通与创作者分润的商业模式。