飞书集成 3 大智能 AI:GPT-3.5、DALL·E、Whisper,实现语音对话、角色扮演、多话题讨论、图片创作、表格分析、文档导出等功能
最近青小蛙又发现了一个新的有趣的项目:Leizhenpeng/feishu-chatgpt,它能够将 GPT-3.5、DALL·E、Whisper 接入飞书,实现语音对话、角色扮演、多话题讨论、图片创作、表格分析、文档导出等功能。@Appinn
其实这个项目叫 feishu-openai 可能更贴切一些
原理是通过飞书的企业自建应用,建立一个机器人,然后机器人通过 Webhook 与项目交互,从而引入了 OpenAI 的三大项目。
功能
- 语音交流:私人直接与机器人畅所欲言
- 多话题对话:支持私人和群聊多话题讨论,高效连贯
- 文本成图:支持文本成图和以图搜图
- 角色扮演:支持场景模式,增添讨论乐趣和创意
- 上下文保留:回复对话框即可继续同一话题讨论
- ⏰ 自动结束:超时自动结束对话,支持清除讨论历史
- 富文本卡片:支持富文本卡片回复,信息更丰富多彩
- 交互式反馈:即时获取机器人处理结果
开发中的功能
- 场景预设:内置丰富场景预设,方便用户管理场景
- 历史回档:轻松回档历史对话,继续话题讨论
- 管理员模式:内置管理员模式,使用更安全可靠
- 多token负载均衡:优化生产级别的高频调用场景
- ↩️ 支持反向代理:为不同地区的用户提供更快、更稳定的访问体验
- 与飞书文档互动:成为企业员工的超级助手
- 话题内容秒转PPT:让你的汇报从此变得更加简单
- 表格分析:轻松导入飞书表格,提升数据分析效率
部署
支持 Serverless 云函数、本地环境、Docker、二进制安装包多种渠道部署,具体见 GitHub 页面,非常详细:
- GitHub
另外也提供了飞书机器人的创建教程。对于开发者来说,相当于保姆级了。
原文:https://xbcpy.com/
GPT-3.5、DALL·E、Whisper 分别是什么
这三者均为 OpenAI 的产品:
GPT-3.5 是由 OpenAI 在 2022年6月发布的人工智能文本生成模型,是GPT-3的升级版。它比GPT-3更强大,能够生成更高质量的文章、翻译、自然语言处理等。GPT-3.5是由OpenAI开发的,采用了更高级的机器学习技术,具有更高的语言理解能力和更强的创造力。
DALL·E 是 由 OpenAI 在2021年发布的图像生成AI模型。该模型能够将自然语言描述转换为相关的图像。例如,当用户输入“火车站前的猫”时,DALL·E 可以生成一张火车站前的有一只猫的图像。DALL·E的技术依赖于深度学习和生成对抗网络 (GANs) 技术。
Whisper 是由 OpenAI 在 2022 年推出的一项新技术,它是一种语音合成技术,可以生成非常逼真的人声。Whisper 能够生成在多种语音干扰条件下清晰的语音,还可以实时响应并自动调整语音内容以适应不同的应用场景。该技术还具备个性化合成功能,可以根据特定讲话人的单词、语音、口音等信息,生成逼真的语音。Whisper 技术应用于语音识别、智能客服、教育交互等多个领域,为语音应用提供更加逼真的人机交互体验。