python elasticsearch环境搭建详解
作者:古月月月胡 发布时间:2021-03-31 03:50:42
标签:python,elasticsearch
windows下载zip
linux下载tar
下载地址:https://www.elastic.co/downloads/elasticsearch
解压后运行:bin/elasticsearch (or bin\elasticsearch.bat on Windows)
检查是否成功:访问 http://localhost:9200
linux下不能以root用户运行,
普通用户运行报错:
java.nio.file.AccessDeniedException
原因:当前用户没有执行权限
解决方法: chown linux用户名 elasticsearch安装目录 -R
例如:chown ealsticsearch /data/wwwroot/elasticsearch-6.2.4 -R
PS:其他Java软件报.AccessDeniedException错误也可以同样方式解决,给 执行用户相应的目录权限即可
2|0代码实例
如下的代码实现类似链家网小区搜索功能。
从文件读取小区及地址信息写入es,然后通过小区所在城市code及搜索关键字 匹配到对应小区。
代码主要包含三部分内容:
1.创建索引
2.用bulk将批量数据存储到es
3.数据搜索
注意:
代码的es版本交低2.xx版本,高版本在创建的索引数据类型有所不同
#coding:utf8
from __future__ import unicode_literals
import os
import time
import config
from datetime import datetime
from elasticsearch import Elasticsearch
from elasticsearch.helpers import bulk
class ElasticSearch():
def __init__(self, index_name,index_type,ip ="127.0.0.1"):
'''
:param index_name: 索引名称
:param index_type: 索引类型
'''
self.index_name =index_name
self.index_type = index_type
# 无用户名密码状态
#self.es = Elasticsearch([ip])
#用户名密码状态
self.es = Elasticsearch([ip],http_auth=('elastic', 'password'),port=9200)
def create_index(self,index_name="ftech360",index_type="community"):
'''
创建索引,创建索引名称为ott,类型为ott_type的索引
:param ex: Elasticsearch对象
:return:
'''
#创建映射
_index_mappings = {
"mappings": {
self.index_type: {
"properties": {
"city_code": {
"type": "string",
# "index": "not_analyzed"
},
"name": {
"type": "string",
# "index": "not_analyzed"
},
"address": {
"type": "string",
# "index": "not_analyzed"
}
}
}
}
}
if self.es.indices.exists(index=self.index_name) is True:
self.es.indices.delete(index=self.index_name)
res = self.es.indices.create(index=self.index_name, body=_index_mappings)
print res
def build_data_dict(self):
name_dict = {}
with open(os.path.join(config.datamining_dir,'data_output','house_community.dat')) as f:
for line in f:
line_list = line.decode('utf-8').split('\t')
community_code = line_list[6]
name = line_list[7]
city_code = line_list[0]
name_dict[community_code] = (name,city_code)
address_dict = {}
with open(os.path.join(config.datamining_dir,'data_output','house_community_detail.dat')) as f:
for line in f:
line_list = line.decode('utf-8').split('\t')
community_code = line_list[6]
address = line_list[10]
address_dict[community_code] = address
return name_dict,address_dict
def bulk_index_data(self,name_dict,address_dict):
'''
用bulk将批量数据存储到es
:return:
'''
list_data = []
for community_code, data in name_dict.items():
tmp = {}
tmp['code'] = community_code
tmp['name'] = data[0]
tmp['city_code'] = data[1]
if community_code in address_dict:
tmp['address'] = address_dict[community_code]
else:
tmp['address'] = ''
list_data.append(tmp)
ACTIONS = []
for line in list_data:
action = {
"_index": self.index_name,
"_type": self.index_type,
"_id": line['code'], #_id 小区code
"_source": {
"city_code": line['city_code'],
"name": line['name'],
"address": line['address']
}
}
ACTIONS.append(action)
# 批量处理
success, _ = bulk(self.es, ACTIONS, index=self.index_name, raise_on_error=True)
#单条写入 单条写入速度很慢
#self.es.index(index=self.index_name,doc_type="doc_type_test",body = action)
print('Performed %d actions' % success)
def delete_index_data(self,id):
'''
删除索引中的一条
:param id:
:return:
'''
res = self.es.delete(index=self.index_name, doc_type=self.index_type, id=id)
print res
def get_data_id(self,id):
res = self.es.get(index=self.index_name, doc_type=self.index_type,id=id)
# # 输出查询到的结果
print res['_source']['city_code'], res['_id'], res['_source']['name'], res['_source']['address']
def get_data_by_body(self, name, city_code):
# doc = {'query': {'match_all': {}}}
doc = {
"query": {
"bool":{
"filter":{
"term":{
"city_code": city_code
}
},
"must":{
"multi_match": {
"query": name,
"type":"phrase_prefix",
"fields": ['name^3', 'address'],
"slop":1,
}
}
}
}
}
_searched = self.es.search(index=self.index_name, doc_type=self.index_type, body=doc)
data = _searched['hits']['hits']
return data
if __name__=='__main__':
#数据插入es
obj = ElasticSearch("ftech360","community")
obj.create_index()
name_dict, address_dict = obj.build_data_dict()
obj.bulk_index_data(name_dict,address_dict)
#从es读取数据
obj2 = ElasticSearch("ftech360","community")
obj2.get_data_by_body(u'保利','510100')
来源:https://www.cnblogs.com/i-love-python/p/11443978.html


猜你喜欢
- 按照网上之前版本的操作,将my.ini中的skip-grant-tables注释去掉,然后在命令行中以mysql -u root -p可以直
- 以下来自John Hann的实现,这段代码引起了我的注意,它用巧妙的方法把方法调用的结果缓存起来了。代码解析:// memoize: 使用m
- 本文实例为大家分享了python实现udp传输图片的具体代码,供大家参考,具体内容如下首先要了解UDP的工作模式对于服务器,首先绑定IP和端
- 2. 从函数开始2.1. 定义一个函数如下定义了一个求和函数:def add(x, y): return
- python实现超市扫码仪计费的程序主要是使用超市扫码仪扫商品的条形码,读取商品信息,实现计费功能。主要用到的技术是串口通信,数据库的操作,
- 请求:HTTP 请求报文由请求行、请求头部、空行、请求包体4个部分组成,如下图所示:请求行:请求行由方法字段、URL 字段 和HTTP 协议
- 1. 如何停止任务?我们可以通过 asyncio.Task 对象上的 cancel() 方法取消任务。如果任务被取消,cancel() 方法
- python3.6下载地址: https://www.python.org/ftp/python/3.6.4/Python-3.6.4.tg
- 程序只要在运行,就免不了会出现错误,错误很常见,比如Error,Notice,Warning等等。在PHP中,主要有以下3种错误类型。1.注
- 目录0x01 字符串(string)引号转义拼接字符串长字符串索引( indexing)运算符in创建列表切片赋值0x02 字符串格式化模板
- 打开终端 切换到根目录 [shell@localhost ~]# su -安装Mysql5.5之前先卸载CentOS自带的Mysql5.0。
- 环境准备创建QQ互联应用创建一个QQ互联应用,并获取到App ID和App Key。QQ互联官网:https://connect.qq.co
- 作者:丁仪来源:https://chengxuzhixin.com/blog/post/mysql_zhong_yao_ri_zhi_wen
- 步骤:1、新建一个空文件,文件名为hhhh2、初始化git init3、自己要与origin master建立连接(下划线为远程仓库链接)g
- 登陆页login.asp:<% if request.Form.count>0 then ses
- 重装电脑,在windows和虚拟机里面的Ubuntu里都安装了Pycharm专业版,安装的时候我都选择了vim插件,装好之后打开发现ctrl
- <?php // fix 404 pages: header('HTTP/1.1 200 OK'); // set 4
- 像微博一类的平台上传图片时,平台都会添加一个水印,宣誓着对图片的所有权,我们自己的博客平台也可以给自己的图片添加上水印。还是用 Pillow
- 工厂模式: “工厂”即表示一个负责创建其他类型的对象的类,通常情况下,一个工厂的对象会有一个或多个方法与之关联,这些方法用于创建不同类型的对
- 上一篇文章介绍了并发和多线程的概念,这次就来向大家上一个实战来讲解一下如何真正的运用上多线程这个概念。有需要的可以看看我之前这篇文章:Pyt