TEN Agent
Weekly Pick
TEN Agent 是一个基于开源框架 TEN Framework 的实时对话式 Voice Agent 开发工具,支持多模态互动和实时语音打断,集成多种主流模型及组件,适用于多种语音交互场景。
TEN Agent 是一个为开发者提供的快速、高效的工具,用于构建实时对话式 Voice Agent。它基于开源框架 TEN Framework,支持语音、图像等多种输入方式,并具备实时语音打断功能,为用户带来自然的交互体验。TEN Agent 已集成 Gemini 2.0、OpenAI Realtime、DeepSeek、RTC 等多种模型及组件,适配 Dify、Coze 主流编排工具,同时支持 ESP32。其核心特点包括免费开源、完整的音视频传输解决方案(低延时、可打断)、集成全球主流模型、接入主流编排工具以及支持 ESP32。应用场景涵盖 AI 语音聊天助手、智能陪伴硬件、AI 智能外呼中心、同声传译与 AI 会议翻译等。