easy-gpt4o
一个用200行代码实现类似GPT-4o多模态效果的项目,通过多模型组合方案展示如何实现多模态功能,并支持自定义模型替换和工作流程定制。
这个项目的意义并不是否定 GPT-4o 这一产品,事实上,我也承认,GPT-4o 是我使用过用户体验最好的多模态模型。但是,我们必须承认的是,GPT-4o 中,o 所代表的 Omnipotent 并不是真的那么强大。首先,项目用的都是几个月之前的 API,目的是证明我们完全可以用多模型组合的方案实现多模态效果。其次,博客里给出了可以达到实时效果的并行方案,如果不使用 API 调用,部分环节自己部署,可以达到实时交互效果。最后,我希望用这个项目重新解放大家的想象力,项目的每一个环节都可以替换成大家自己的模型,也可以对整个工作流程提出定制化的玩法。代码:https://github.com/Chivier/easy-gpt4o/实现细节和后续思考:easy-gpt4o - 200行代码实现 GPT-4o 的效果