Tag archives for Java - Page 6

开源软件

开源搜索引擎 Open Search Server

Open Search Server(OSS )是一个基于Java编写的开源搜索引擎和全文搜索算法套件。可多语言对文档进行索引。多语言分析器将句子切成词,然后基于文档的语言将lemmatisation算法运用在词语之上。支持多种文档格式包括:XML、HTML、PDF、Word和PowerPoint等。此外还拥有一个便于操作的Web操作界面。 官网下载:#download
继续阅读
开源软件

php和Java的拥抱结合-JPHP

JPHP是一个基于 Java VM 的 PHP 编译器。 类似 javac ,可将 PHP 源码编译成 JVM 的字节码并在 JVM 中执行。 支持 PHP (+)的诸多特性,JDK +, 支持Android平台。 作者表示JPHP并不是要取代Zend PHP engine 或 Facebook HHVM. 该项目目的: 可在 PHP 中使用 Java 类库 通过 JIT 和 JVM 来提升性能 替换 Zend 糟糕的库,使用更好的运行时库 在非 Web 应用中使用 PHP 语言 字符串和线程的 Unicode 官…
继续阅读

开源的Web爬虫webmagic

webmagic是一个开源的Java垂直爬虫框架,覆盖爬虫的整个流程,也是很好的学习爬虫开发的材料。 webmagic的主要特色: 完全模块化的设计,强大的可扩展性。 提供丰富的抽取页面API。 无配置,但是可通过POJO+注解形式实现一个爬虫。 支持多线程。 支持分布式。 支持爬取js动态渲染的页面。 无框架依赖,可以灵活的嵌入到项目中去。 源码下载: 
继续阅读