FreeParser是一款结合了OCR(光学字符识别)和LLM(大语言模型)的文档信息提取工具。它能够将PDF、图片等文件转换为markdown格式,供下游大模型使用,同时也能提取文档中的关键信息。支持多种输入格式包括DOCX、PPTX、PDF、XLSX、JPG、PNG、BMP和TIFF,输出格式支持md、json和csv。此外,用户还可以自定义提取字段和prompt,以满足不同的需求。
FreeParser是一款结合了OCR(光学字符识别)和LLM(大语言模型)的文档信息提取工具。它能够将PDF、图片等文件转换为markdown格式,供下游大模型使用,同时也能提取文档中的关键信息。支持多种输入格式包括DOCX、PPTX、PDF、XLSX、JPG、PNG、BMP和TIFF,输出格式支持md、json和csv。此外,用户还可以自定义提取字段和prompt,以满足不同的需求。