easy-gpt4o

一个用200行代码实现类似GPT-4o多模态效果的项目,通过多模型组合方案展示如何实现多模态功能,并支持自定义模型替换和工作流程定制。

Check out easy-gpt4o on CurateClick

• Copy the embed code to showcase this product on your website

• Share on X to spread the word about this amazing tool

这个项目的意义并不是否定 GPT-4o 这一产品,事实上,我也承认,GPT-4o 是我使用过用户体验最好的多模态模型。但是,我们必须承认的是,GPT-4o 中,o 所代表的 Omnipotent 并不是真的那么强大。首先,项目用的都是几个月之前的 API,目的是证明我们完全可以用多模型组合的方案实现多模态效果。其次,博客里给出了可以达到实时效果的并行方案,如果不使用 API 调用,部分环节自己部署,可以达到实时交互效果。最后,我希望用这个项目重新解放大家的想象力,项目的每一个环节都可以替换成大家自己的模型,也可以对整个工作流程提出定制化的玩法。代码:https://github.com/Chivier/easy-gpt4o/实现细节和后续思考:[easy-gpt4o - 200行代码实现 GPT-4o 的效果](https://blog.chivier.site/2024-05-15/2024/200-%E8%A1%8C%E4%BB%A3%E7%A0%81%E5%A4%8D%E5%88%BB%E4%B8%80%E4%B8%AA-GPT-4o/)