外部链接

本页列出了使用 PDFBox 的项目和有关 PDFBox 的文章。 请提交改进问题,以将新项目或文章添加到此页面,或更新现有链接上的信息。

使用 PDFBox 的项目

项目名称 许可证 项目描述
露天 LGPL - 提供商业服务/支持/培训 Alfresco是一个开源的、开放标准的内容存储库,由最有经验的内容管理团队构建,其中包括Documentum的联合创始人。
阿帕奇坚果 Apache 许可证 v2 Apache Nutch是开源的网络搜索软件。它建立在Apache Lucene之上,增加了Web细节,例如爬虫,链接图数据库,HTML和其他文档格式的解析器等。
阿帕奇提卡 Apache 许可证 v2 Apache Tika 是一个工具包,用于使用现有的解析器库从各种文档中检测和提取元数据和结构化文本内容。
乔米克 通用软件总目录 乔米克是漫画书档案的观众。
Jpdf单位 Apache 许可证 v2 pdfUnit 是一个框架,用于使用 JUnit 测试框架测试生成的 pdf 文档。
生命之光门户 麻省理工学院 Liferay Portal是一个开源门户,通过提供不同应用程序的整合视图,帮助组织更有效地协作。
卢斯基因 艺术许可 LuceGene是一个开源文档/对象搜索和检索系统,专门针对生物信息学文本数据库和文档进行了调整。
卢特斯 类 BSD Lutece是一个门户引擎,允许您根据HTML,XML内容轻松创建网站或内部网。
MMBase萤光烯模块 MPL MMBase Lucene模块是MMBase内容管理系统的插件(模块),它使Lucene能够通过其内容进行全文搜索,并且由于PDFBox也PDF内容。
开放CMM LGPL MMBase Lucene模块是MMBase内容管理系统的插件(模块),它使Lucene能够通过其内容进行全文搜索,并且由于PDFBox也PDF内容。
开放搜索服务器 GPLv3 基于最佳开源技术的开源搜索引擎和爬虫。它是一个现代搜索引擎和一套高性能的全文搜索算法。
Orbeon PresentationServer LGPL Orbeon PresentationServer (OPS) 是一个基于 J2EE 的开源平台,用于以 XML 为中心的 Web 应用程序。OPS 是围绕 XHTML、XForms、XSLT、XML 管道和 Web 服务构建的,这使其成为捕获、处理和呈现 XML 数据的应用程序的理想选择。商业咨询/培训/支持可通过Orbeon获得。
PDFJuice Apache 许可证 v2 该项目提供了一些工具,可帮助用户从PDF文档中提取结构化信息。目前,该程序能够将它们导出为HTML。
瑞宇范围 商业 REWOO Scope是一款企业内容管理(ECM)软件,用于组织,构建和整合企业数据。Apache PDFBox是阅读和索引PDF文档不可或缺的一部分。
搜索布洛克斯 商业 SearchBlox是一款专为Java 2企业版(J2EE)平台设计的高性能企业搜索软件。
语义学者 基于网络 语义学者是AI2的一项新服务,用于科学文献搜索和发现,专注于语义和文本理解。
SimplexRepaginator Apache 许可证 v2 单面分页器将单面扫描的 PDF 转换为正确双面分页的 PDF,反之亦然。
MPL 梗犬是用于快速开发Web,内部网和桌面搜索引擎的软件。
特里博尼银杏 商业 Triboni GinkGO是一个高度可扩展的J2EE服务平台,它基于简单的XML业务对象定义和脚本语言。与 XSLT 一起,可以在很短的时间内配置以内容为中心的 Web 应用程序。

文章/书籍

文章名称 文章摘要
为您的 iPod
构建 eDoc 阅读器 第 1 部分 - 用户界面
第 2 部分 - 文档阅读引擎
3 部分 - 与 PDFBox 集成
一篇由三部分组成的文章,讨论 PodReader 应用程序的实现。PodReader 是用 Objective-C 编写的 Cocoa 应用程序,文章讨论了如何使用 Cocoa-Java 桥与 Java 版本的 PDFBox 集成。
露西恩在行动 一本讨论与lucene搜索引擎集成的书。其中一章讨论了如何索引各种文件格式,并重点介绍了用于索引PDF文档的PDFBox。
Java 开发人员杂志 - 2005 年 <> 月 由 PDFBox 的首席开发人员撰写的一篇文章,讨论了使用 PDFBox 功能进行文本提取和 AcroForm 集成。
Refactoring trends across N versions of N Java open source systems: an empirical study This article describes an empirical study of multiple versions of a range of open source Java systems in an attempt to understand whether refactoring occur and, if so, which types of refactoring were most (and least) common. PDFBox is used as a case study.