Tag archives for Java - Page 7

开源的Web爬虫webmagic

webmagic是一个开源的Java垂直爬虫框架,覆盖爬虫的整个流程,也是很好的学习爬虫开发的材料。 webmagic的主要特色: 完全模块化的设计,强大的可扩展性。 提供丰富的抽取页面API。 无配置,但是可通过POJO+注解形式实现一个爬虫。 支持多线程。 支持分布式。 支持爬取js动态渲染的页面。 无框架依赖,可以灵活的嵌入到项目中去。 源码下载: 
继续阅读

开源全文搜索服务器 Solr

Apache Solr 是一个开源的搜索服务器。Solr 使用 Java 语言开发,主要基于 HTTP 和 Apache Lucene 实现。文档通过Http利用XML加到一个搜索集合中。查询该集合也是通过 http收到一个XML/JSON响应来实现。它的主要特性包括:高效、灵活的缓存功能,垂直搜索功能,高亮显示搜索结果,通过索引复制来提高可用性,提 供一套强大Data Schema来定义字段,类型和设置文本分析,提供基于Web的管理界面等。 官方下载:
继续阅读

开源视频会议系统 OpenMeetings

OpenMeetings是一个开源的多语言跨平台可定制视频会议和协作系统,基于Apache License 2开源协议。它支持音频、视频,支持共享左面,文件协作处理,它还包含一个白板,通过白板可以导入各种格式的图片。它基于OpenLaszlo的新流媒体格式和开源的Flash服务器Red5 (基于Java的开源流媒体服务器)。 OpenMeetings视频会议具有如下特点: 1、基于P2P技术,服务器压力小、流畅。用户之间可以互相获取数据,减轻对服务器的压力。 2、视频和音频即时交流,可以看到与会人员的视频图像,听到…
继续阅读