使用pymongo解析文本格式日志后放入mongo

banana000

2019-07-01

思路

拿到的文本是二进制的，在查看文件的时候可以加上-rb以二进制读的形式打开。

文件格式如下：

b’2019-03-29 10:55:00\t0\192.168.31.123:8080\t5\t12345678\t0\t44560\t953864\t2\t192.168.31.123\tmd5\n’

可以看到日志里面的分隔符是制表符t，行末尾有换行符n

处理日志文件的基本逻辑

链接数据库
逐行读txt
将一行的数据分割为数组
将数据放入list
将list逐条转化为json
存入数据库

分片集群的mongo链接

用于存储日志的mongo集群有三个分片：flux-stat-1.mongo:27017,flux-stat-2.mongo:27017和flux-stat-3.mongo:27017.

假设用户名是flux-stat，密码是flux-stat-mongo123，登录方法：

from pymongo import MongoClient
import urllib.parse
#创建MongoDB链接对象
username = urllib.parse.quote_plus(‘flux-stat’)
password = urllib.parse.quote_plus(‘flux-stat-mongo123’)
uri = 'mongodb://%s:%[email protected]:27017, flux-stat-2.mongo:27017, flux-stat-3.mongo:27017/admin' % (username,password)
client = MongoClient(uri)

注意：username和password必须要进行转换，否则链接不正确

pymongo逐行读取日志文本

with open(“d:/user/ServerLog/test.txt”,’rb’) as file:
    for line in file:
        #这里放操作
file.close()

分割日志内容转化为json，并把每行json放到数组中

#引入json模块
import json
total=[]
logList = line.split(‘\t’)    #line分割为list
keyList = [‘time’,’status’,’ip’,’type’,’userid’,’v1’,’v2’,’v3’,’v4’,’ip’,’md5’]    #key的list
logDict = dict(zip(keyList, logList))    #把二者以字典的方式拼起来
logJson = json.dumps(logDict)    #把字典转换为string形式的json
#json转字典的方法为dictinfo = json.loads(json_str)
total.append(logJson)

日志存入mongo

insert_one和insert_many是两种插入的方式，但是采用insert_one进行逐条插入会进行大量的访问，大幅降低插入效率，采用insert_many进行json为基本单位的list批量插入，效率明显提高。

db = client['log']             #获取数据库
coll = db[‘data’]              #获取表
coll.insert_many(total)        #插入到数据库

mongo pymongo stat flux

banana000

0 关注 0 粉丝 0 动态

关注关注

Python3安装Pymongo详细步骤

本篇教程展示如何安装Pymongo库，编辑器使用的当然是pycharm。我们这里直接使用pycharm来安装Pymongo库，和pycharm的mongodb相关管理插件。这个借助pycharm来安装非常简单。首先根据下面的菜单路径打开相关窗口。pycha

Allen0 2017-05-26

在PyCharm中安装Mongo Plugin的详细教程

波大菜菜 2020-11-16

linux mongo数据丢失排查

最近自己的一个服务器跑的一个WEB，数据库使用的mongo，有一天忽然发现保存的数据没了。第一个想到的是未授权，难道被挖矿的恶意清空了？但是不现实啊我bind是在本地，互联网访问不到，火墙也做了策略。然后以为自己的mongo配置文件，重启了mongo，重

cuixingwudi 2020-04-15

Python与mongo交互

table.find_one # 返回一个字典形式数据。table.find() # 返回一个mongo对象, 需要使用for循环遍历取值

youandme 2020-02-26

应用安全 - 数据库 | 工具 - mongo数据库 - mongo-express - 漏洞 - 汇总

CVE-2019-10758. Date. 2020. 类型。远程代码执行。影响范围。<0.54.0. 前置条件。（1）MACOS. 复现

真新镇的涅法雷姆 2020-01-04

Shell中Bash的基本功能(二)

1）历史命令的查看[ ~]# history [选项] [历史命令保存文件]选项：-c：清空历史命令-w：把缓存中的历史命令写入历史命令保存文件。如果不手工指定历史命令保存文件，则放入默认历史命令保存文件~/.bash_history 中。docker

baixiaoshi 2019-12-11

使用docker部署influxdb与 mongo的常用命令

sudo docker run -p 27017:27017 -v xxx:/xxx--name xxxx -d mongo:latestsudo docker run -d -p8086:8086 --name xxx influxdb:latest.

TaoTaoFu 2019-11-19

mongo EOF（二）

上一节mongo EOF中，关于容器的配置，只是粗略的使用了Docker-Compose-MongoDB-Replica-Set项目提供好的docker-compose.yml文件。在使用过程中，我发现这个文件本身一些不如意的地方。首先，services中

yss0 2019-11-19

使用docker部署influxdb与 mongo的常用命令

sudo docker run -p 27017:27017 -v xxx:/xxx--name xxxx -d mongo:latest. 以上所述是小编给大家介绍的使用docker部署influxdb与 mongo的常用命令，希望对大家有所帮助，如果大

蜡笔小鑫爱看雪 2019-05-17

php-fpm重启导致的程序执行中断问题详解

业务接口 /3/xx/vgift/send 调用礼物系统 sendPresent 接口完成送礼，之后写mongo，但是php error log 里却查不到任何mongo异常日志。这里有提到，php-fpm then responds to severa

aaLiweipeng 2019-04-29

Centos 安装mongod

如果64位安装出错尝试用32位的

81971834 2012-02-17

mongo 启动方式

--dbpath arg directory for datafiles - defaults to/data/db. --logpath arg log file to send write to inst

Onlyruiwen 2016-05-30

使用Docker部署Nginx+Flask+Mongo的应用

使用Docker部署Nginx+Flask+Mongo的应用Nginx做为服务器，Mongo为数据库支持，Flask为Python语言的Web框架，利用Docker的容器特性，可以简单地部署在linux服务器上项目准备项目主要目录如下。该文件的目的是，启动

dockerhc 2019-07-01

spring mongo 注解

@Idid. @DbRef参考其他文档。@Field字段名。@Version版本

shuiluobu 2016-11-11

mongo连接分析

在mongo数据库同样存在，经常看到有网友在问mongo 连接了数据库要不要关，怎么关。内置的数据库连接池是单线程还是多线程，mongo服务器为什么会杀游标，杀连接诸如此类的问题，其实这类问题基本上就是连接池的问题，而很多和关系型数据库是类似的，并不是mo

bluetears 2019-06-27

Morphia整合spring

<?xml version="1.0" encoding="UTF-8"?>. <constructor-arg value="127.0.0.1"></constr

YangHuiLiang 2011-02-23

使用mongo shell远程连接数据库

tar -xvf mongodb-linux-x86_64-3.2.4.tgz这个里头的bin就包含了mongoshellmongo mydb --username user1 --host 192.168.99.100 --port 27017 --p

touchfuture 2019-06-26

2017年终总结

序又到了写年终总结的时候了。每当这个时候思绪总是翻江倒海，因为太久没有反思和总结的缘故，一年才总结一次，确实是有点久，欠的账的太多，梳理起来有点费劲。这里依旧还是写跟点跟工作/技术相关的总结。盘点2017这一年自己从前到后主导了个小项目，技术体系使用的op

engchina 2019-06-26

Docker Mongo 设置主从备份

首先设置 Mongodb config 文件.再添加一个仲裁服务器进入 rs.add

lnkToKing 2019-06-25

mongo中模糊查询的综合应用

"name" : "中国正大","content" : "中国正大相关信息",projection ：可选，使用投影操作符指定返回的键。查询时返回文档中所有键值，只需省略该参

dalian 2019-04-13

安科网

使用pymongo解析文本格式日志后放入mongo

banana000

思路

分片集群的mongo链接

pymongo逐行读取日志文本

分割日志内容转化为json，并把每行json放到数组中

日志存入mongo

banana000

相关推荐

Python3安装Pymongo详细步骤

在PyCharm中安装Mongo Plugin的详细教程

linux mongo数据丢失排查

Python与mongo交互

应用安全 - 数据库 | 工具 - mongo数据库 - mongo-express - 漏洞 - 汇总

Shell中Bash的基本功能(二)

使用docker部署influxdb与 mongo的常用命令

mongo EOF（二）

使用docker部署influxdb与 mongo的常用命令

php-fpm重启导致的程序执行中断问题详解

Centos 安装mongod

mongo 启动方式

使用Docker部署Nginx+Flask+Mongo的应用

spring mongo 注解

mongo连接分析

Morphia整合spring

使用mongo shell远程连接数据库

2017年终总结

Docker Mongo 设置主从备份

mongo中模糊查询的综合应用

banana000