AI-Media2Doc

AI-Media2Doc是一个开源的AI创作助手,支持将视频/音频文件转换为各种风格的文章(如知识笔记、小红书风格等),可在本地部署,使用自己的API key,所有任务记录保存在本地。支持AI实时对话和思维导图生成。

项目名称: AI-Media2Doc🔥GitHub地址https://github.com/hanshuaikang/AI-Media2Doc### 项目特点- 完全开源[MIT]协议, 支持本地部署, 无需登录注册, 使用自己的大模型的 api key 即可,所有任务记录均保持在本地。- 支持视频音频文件一件转换成各种风格的文章并保留原始音频识别文本。- 支持生成 知识笔记/内容总结/小红书/微信公众号/思维导图 等风格的文档类型。- 支持针对视频内容进行 AI 实时对话。- 为有同样想法的朋友提供了可行的实施方案。### 未来的计划- 支持更多的文档风格的输出, 例如架构图/流程图,字幕文件等。- 支持智能截取视频关键帧插入到文章中, 实现真正的图文并茂。- 支持通过 docker 的方式一键部署。- 等### 项目截图只需要拖入已经下载好的视频文件,选择图文风格点击开始即可Image针对历史任务支持 ai 多轮对话, 方便提炼内容Image生成的思维导图支持一键下载导入到开源的思维导图进行编辑Image### 项目初衷AI 视频创作助手源于我年初的一个想法, 作为一个喜欢阅读的人, 我更希望将一些视频内容转化为文字, 方便我进行二次阅读思考和总结记录笔记, 但市面上并没有一个好的工具来实现这个想法, 大多数工具都需要登录和付费, 我不太想在互联网上注册过多的账号, 同时也不想将自己想要总结的内容上传至除了云厂商之外的第三方平台,因此我开发了这个小应用,MIT 协议, 任何人都可以以极低的成本去体验音视频转文本。