标签 lucene 下的文章

  • 📂mysql-反向搜索:每个文档的短语教程

    我有一个充满短语(80-100个字符)和一些冗长的文档(50-100Kb)的数据库,我想要给定文档的短语排名列表;而不是搜索引擎的通常输出,而是给定短语的文档列表.我以前使用过MySQL全文索引,并研究了Lucene,但从未使用过. 他们似乎都倾向于比较短(搜索词)和长(文档).您将如何获得相反的结果?解决方法:我对Wikipedia标题数据库做了类似的工作,每个〜50KB的文档设法减少了...

  • 📂python-在Ubuntu 14.04上构建Pylucene(可信任的Tahr)教程

    按照安装instructions,JCC已成功构建.安装的依赖项是: ant,openjdk-7-jdk,python-setuptools,python-dev.然后继续制作pylucene,在“ Makefile”中,我选择与Ubuntu 11相对应的规格.# Linux (Ubuntu 11.10 64-bit, Python 2.7.2, OpenJDK 1.7, setu...

  • 📂我如何在数据库中存储Lucene索引?教程

    这是我的示例代码:MysqlDataSource dataSource = new MysqlDataSource(); dataSource.setUser("root"); dataSource.setPassword("ncl"); dataSource.setDatabaseName("userdb"); dataSour...

  • 📂在Java / MySQL / Hibernate Search / Lucene环境中建议标签教程

    我正在开发一个基于Web的应用程序,该应用程序使我们的用户可以发布典型的博客/微博客/论坛类型的帖子,而我们遇到的一个问题是我们的用户并不是经常标记其内容.由于标签在我们的应用中非常重要,原因有几个,因此我们希望带动用户走向标签行为.我们实施了哈希标记,这似乎起到了一定作用,并且我们还打算实施某种形式的游戏化来鼓励这种做法.除了上述内容之外,我们还希望实现标签建议(基本上是StackOver...

  • 📂mysql – 在选择最佳搜索引擎时感到困惑教程

    目前我正在使用定制的Java搜索引擎.此Java引擎使用Lucene索引MySql记录.搜索引擎有几个问题:1-搜索结果不准确.2-它不使用加权算法来使最匹配的结果在顶部.3-它耗费了大量的内存.4-由于各种原因,很难维护.所以我需要做的是使用现成的搜索引擎,无论是商业还是开源,都可以顺利地与我的系统集成并解决我的问题(尽可能多).你能不能给我选择,在哪里看看.谢谢, Wa’el解决方法:...

  • 📂使用Lucene / PHP索引大型数据库教程

    下午的家伙,尝试使用Lucene的Zend端口索引170万行表.在几千行的小测试中,它完美地工作,但是一旦我尝试将行数增加到几万,它就会超时.显然,我可以增加php允许脚本运行的时间,但是看到360秒会得到~10,000行,我不想想要耗费170万次需要多少秒.我也尝试让脚本运行几千,刷新,然后运行接下来的几千,但这样做每次都清除索引.有什么想法吗?谢谢 :)解决方法:我很遗憾地说,因为Zen...

  • 📂linux – Lucene上打开文件太多错误教程

    我正在研究的项目是索引一定数量的数据(带有长文本),并将它们与每个区间的单词列表(大约15到30分钟)进行比较.经过一段时间后,比如第35轮,在第36轮开始索引新的数据集时,发生了这样的错误: [ERROR] (2011-06-01 10:08:59,169) org.demo.service.LuceneService.countDocsInIndex(?:?) : Exceptio...

  • 📂mysql – 在java中实现搜索过滤器教程

    我们需要针对用户个人资料为我的社交网站实施搜索过滤器(类似于Net-log),对个人资料的过滤包括年龄范围,性别和兴趣我们在MySQL上运行大约1M个配置文件,MySQL似乎不是实现这些过滤器的正确选择,所以我们也在考虑Cassandra,那么实现这种过滤器的最佳方法是什么,结果需要非常快例如年龄= 18-24岁,性别=男性和兴趣=足球年龄,性别和兴趣是varchar编辑: 让我重新解释一...

  • 📂java – 使用solr索引和搜索MySQL教程

    (我已经在下面的XML中显示了它)大家好我想用solr索引我的MySQL数据库表.我已经安装了必要的java组件/适配器等.我的数据库名为’test\_db’,其中的表名为’table\_tb’.该表包含2列(字段)-Field 1称为“ID”,是一个自动增量的主键整数 -Field 2被称为’COLA’并且是文本该表有两行(记录)ID = 1和ID = 2,其中一些文本对应于第二列.我已...

  • 📂mysql – 如何通过分组solr中的天数来获取列的总和教程

    我的solr数据如下:{ { "total_amount": 100, "created_at": "2015-07-08T18:30:00Z" }, { "total_amount": 200, "cr...