此列表包含与网页抓取和数据处理相关的 PHP 库。
- 网络请求工具
- 网页抓取框架
- HTML/XML
- 文本处理
- 特定格式处理
- 自然语言处理
- 浏览器自动化和仿真
- 多进程
- 队列
- 云计算
- 电子邮件
- URL 操作
- 网页内容提取
- 异步
- WebSocket
- DNS 解析
- 计算机视觉
- 地理编码
- API 客户端
- 其他 PHP 列表
- Guzzle - 一个全面的 HTTP 客户端。
- Buzz - 另一个 HTTP 客户端。
- Requests - 一个简单的 HTTP 库。
- HTTPFul - 一个可链接的 HTTP 客户端。
- Goutte - 一个简单的网络爬虫。
- PHP Spider - 一个全面的网络蜘蛛。
- TODO
- HTML5 PHP - HTML5 解析器和序列化程序库。
- QueryPath - 一个类似 jQuery 的库,用于在 PHP 中处理 XML 和 HTML 文档。它现在通过 HTML5-PHP 项目包含对 HTML5 的支持。
- DiDOM - 超快速的 HTML 解析器(因为它是建立在纯 PHP 之上的)。
- PHPScraper - 一个高度自以为是的网络界面。
用于解析和操作纯文本的库。
- 通用
- ANSI 到 HTML5 - ANSI 到 HTML5 转换器库。
- Patchwork UTF-8 - 用于处理 UTF-8 字符串的可移植库。
- Hoa String - 另一个 UTF-8 字符串库。
- Stringy - 支持多字节的字符串操作库。
- Color Jizz - 一个用于操作和转换颜色的库。
- Text - 一个文本操作库。
- Flux - 一个正则表达式构建库。
- 音译
- 用户代理
- 设备检测器 - 另一个用于解析用户代理字符串的库。
- Mobile-Detect - 用于检测移动设备(包括平板电脑)的轻量级 PHP 类。
- UA Parser - 一个用于解析用户代理字符串的库。
- 计量单位
- ByteUnits - 一个在二进制和公制系统中解析、格式化和转换字节单位的库。
- PHP Units of Measure - 用于在度量单位之间进行转换的库。
- PHP Conversion - 另一个用于在度量单位之间进行转换的库。
- 电话号码
- LibPhoneNumber for PHP - Google 电话号码处理库的 PHP 实现。
用于解析和处理特定文本格式的库。
- CSV
- CSV - 一个 CSV 数据操作库。
- Office
- PHPWord - 用于处理 Microsoft Word 文档的库。
- PHPExcel - 用于处理 Microsoft Excel 文档的库。
- PHPPowerPoint - 用于处理 Microsoft PowerPoint 文档的库。
- ExcelAnt - 用于操作 Microsoft Excel 文档的库。
- Markdown
- PHP Markdown - Markdown 解析器。
- CommonMark PHP - 一个支持完整 CommonMark 规范 的 Markdown 解析器。
- Parsedown - 另一个 Markdown 解析器。
- Ciconia - 另一个 Markdown 解析器
- Cebe Markdown - 一个快速且可扩展的 Markdown 解析器。
- BBCode
- Decoda - 用于 BBCode 样式标记的轻量级词法字符串解析器。
- JSON
- JsonMapper - 一个将嵌套 JSON 结构映射到 PHP 类的库。
- 电子名片
- vobject - VObject 库允许您轻松解析和操作 iCalendar 和 vCard 对象。
- 文件类型检测
- Hoa Mime - 另一个 MIME 检测库。
- Canal - 确定互联网媒体类型的库。
- Apache MIME 类型 - 解析 Apache MIME 类型的库。
- GeoJSON
- GeoJSON - GeoJSON 实现。
用于处理人类语言的库。
- PHP NlpTools - PHP 中的自然语言处理工具。
- nlpTools - PHP 的自然语言处理工具包。
- php-webdriver - webdriver 的 php 客户端。
- PHP PhantomJS - 通过 PHP 执行 PhantomJS 命令
- Mink - 用于多个浏览器模拟器的通用 API(selenium、zombie.js、goutte)。
- Spork - 一个进程分叉库。
用于异步网络编程的库。
- React - 一个事件驱动的非阻塞 I/O 库。
- Rx.PHP - 一个反应式扩展库。
- Hoa EventSource - 一个事件源库。
- Evenement - 一个事件调度器库。
- Event - 一个专注于领域事件的事件库。
- Broadway - 事件源和 CQRS 库。
- Pheanstalk - 一个 Beanstalkd 客户端库。
- PHP AMQP - 一个纯 PHP AMQP 库。
- Thumper - RabbitMQ 模式库。
- Bernard - 一个多后端抽象库。
- TODO
用于解析电子邮件的库。
用于解析 URL 的库。
- 来自 Web 文档的文本和元数据
- 视频
- Youtube-Downloader - 用于从 youtube 下载视频的 PHP 脚本;还将 youtube 提要解析为播客的 RSS 附件。
使用 WebSocket 的库。
- Ratchet - 一个网络套接字库。
- Hoa WebSocket - 另一个 Web 套接字库。
- Elephant.io - 另一个 Web 套接字库。
- Net_DNS2 - 原生 PHP DNS 解析器和更新器。
- OpenCV-for-PHP - PHP 的 OpenCV 绑定。