python处理日志文件

sunnyhappy0

2020-05-17

python处理日志文件

1 打开日志文件

虽然，日志文件的后缀为.log，但是基本上与文本文件没有区别，按照一般读取文本文件的方式打开即可：

fp =open("e:\\data.log")
fp.close()

应用示例：

View Code

参考链接[1].

2 提取目标信息

日志文件每行字符串由空格分隔，例如对第1个字段（IP、时间等）感兴趣，则使用split()方法对每行字符串进行切片，将第1个子字符串存到列表里，用于下一步处理。

示例代码：

#!/usr/bin/python
# -*- coding: UTF-8 -*-
 
txt = "Google#Runoob#Taobao#Facebook"
 
# 第二个参数为 1，返回两个参数列表
x = txt.split("#", 1)
 
print x

输出结果：

[‘Google‘, ‘Runoob#Taobao#Facebook‘]

参考链接[2].

3 统计分析

在上一步骤中，将感兴趣的目标信息存储到列表中，现使用python统计列表元素出现的次数，参考链接[3]提供了很多实现方法[4]，本文使用collections[5]中的most_common()方法。

示例：

from collections import Counter
def counter(arr):
    return Counter(arr).most_common(2) # 返回出现频率最高的两个数

# 结果：[(2, 3), (1, 2)]

参考链接[3-4-5]

4 后记

完整代码(待整理)：

# -*- coding: utf-8 -*-
"""
Created on Thu Apr 11 08:24:02 2019

@author: Green
"""
#import sys
#import time
from collections import Counter
#import pyExcel
import xlwt
fp =open("d:\\aa.log")
#print len(fp.readlines()) # 3593512
mycount = 0
IPlists = []
for line in fp.readlines():
    # control times====================
    #mycount += 1
    #if mycount > 100:
    #    break
    #==================================

    data = line.split(" ") # 依空格切片
    IP = data[0]
    IPlists.append(IP)

fp.close()

print ‘Length of IPlists:‘, len(IPlists)

#IPlists.count()
IP_CountResult = Counter(IPlists).most_common()
#print IP_CountResult
#print ‘[0][0]‘, IP_CountResult[0][0]
print ‘Length of IP_CountResult:‘, len(IP_CountResult)

f = xlwt.Workbook() # Create workbook
sheet1 = f.add_sheet(u‘sheet1‘,cell_overwrite_ok=True) # Create sheet
row0 = [u‘IP‘, u‘Count‘]
# Create first row
for i in range(0,len(row0)):
    sheet1.write(0, i, row0[i])
for i in range(0,len(IP_CountResult)):
    for j in range(0,len(IP_CountResult[i])):
        sheet1.write(i+1, j, IP_CountResult[i][j])
f.save(‘d:\\IP_CountResult.xls‘) # Save the file


#=====================================
# 测试字符串切片(分割)
# txt = "Google Runoob Taobao Facebook"
# 第二个参数为 1，返回两个参数列表
# x = txt.split(" ", 1)
# print x[0]
#=====================================

    #filename = line[:14]
    #content = line[14:]
    #with open("e:\\"+filename+".txt","w") as fp2:
    #    fp2.write(content+"\n")

其他拓展应用，见链接[6-9]

另，研究pandas在数据处理、绘图等方面的应用。

日志文件 python https target

sunnyhappy0

0 关注 0 粉丝 0 动态

相关推荐

Linux下日志文件过大解决方案

很多Linux服务器里的应用程序都是无间断的输出日志，这对于服务器的硬盘是一个很大的考验。良许之前也分享过一篇文章，介绍如何让应用程序在后台执行：。但是，我们都知道，日志对于我们而言是非常重要的，一量应用程序出现bug，或者服务器宕机，我们必须通过日志文件

风语者 2020-09-18

Linux下Tomcat服务器catalina.out日志文件按天切分

# 将每天的日志文件按照日期命名迁移到其它地方

secondid 2020-06-04

超级有用的15个mysqlbinlog命令

　　在MySQL或MariaDB中，任意时间对数据库所做的修改，都会被记录到日志文件中。例如，当你添加了一个新的表，或者更新了一条数据，这些事件都会被存储到二进制日志文件中。二进制日志文件在MySQL主从复合中是非常有用的，主服务器会发送其数据到远程服务器

BiPerler 2020-05-09

apache2 日志文件太大的解决方案

apache下有个日志文件叫error.log会记录运行过程中的错误，还有个access.log会记录谁访问了你的网站，每一次访问都对应者一条访问记录，也是绝了！1），关闭apache，打开httpd.conf,写出log日志的级别由warn上升到了cri

ErixHao 2020-05-08

Oracle归档日志管理

Oracle以SQL脚本的形式实时记录了数据变化的详细日志，这些日志保存在重做日志文件中。根据重做日志文件，可以对数据库进行备份和恢复。创建Oracle数据库实例的时候，缺省建立三组在线日志，每组一个日志文件。三组日志中只有一组处于活动状态，这组活动的日志

zyjj 2020-04-25

【Oracle11g】17_归档方式和日志文件的操作

Oracle数据库有联机重做日志，这个日志是记录对数据库所做的修改，包括对表作的数据改变，对系统做的改变等。可以使用它，来维护数据的完整性，以及进行数据库的恢复，可以进行日志挖掘。用户修改了记录，然后commit,之后数据库宕机了，所以我们重启数据库，可能

Carlos 2020-04-21

在Linux系统中手动滚动日志

日志滚动log rotation在 Linux系统上是再常见不过的一个功能了，它为系统监控和故障排查保留必要的日志内容，同时又防止过多的日志造成单个日志文件太大。使用 logrotate 命令可以手动执行日志滚动的操作。本文将要介绍的就是手动进行日志滚动的

一路到黑 2020-03-26

另一种办法直接在宿主机上的文件夹内查看Docker镜像运行的日志文件

我们可以用docker ps首先找到某个Docker容器的id，再使用关键字docker logs <容器id>打印出该容器产生的日志：

lihy0 2020-03-26

如何手动轮换Linux上的日志文件

一组日志文件中最旧的日志文件删除后，剩余的日志文件降一格，较新的文件取而代之，成为当前日志文件。这个过程很容易实现自动化，可以根据需要调整详细信息。你可以通过使用logrotate命令手动轮换日志文件。本文中描述的示例适用于Ubuntu和相关的Linux系

Silvercell 2020-03-24

flume实时监控日志文件到hdfs

#上传文件的前缀。#重新定义时间单位。#是否使用本地时间戳。#积攒多少个Event才flush到HDFS一次。#设置文件类型，可支持压缩。#多久生成一个新的文件。#文件的滚动与Event数量无关。# Use a channel which buffers

QAnyang 2020-03-14

MSSQL SERVER收缩日志文件

事务日志记录着在相关数据库上的操作，同时还存储数据库恢复的相关信息。　　收缩日志的原因有很多种，有些是考虑空间不足，有些则是应用程序限制导致的。　　下面介绍的是在简单模式下，进行收缩操作。ALTER DATABASE {DBName} SET RECOVE

zbcaicai 2020-03-08

收缩数据库日志文件

ALTER DATABASE 数据库名 SET RECOVERY SIMPLE WITH NO_WAIT. --‘这里的日志名，如果不知道在sys.database_files里是什么名字的话，可以用以下注释的语句进行查询。ALTER DATABASE 数

ALLWITHLOVE 2020-02-22

Linux中查看日志文件的正确姿势，求你别tail走天下了！

作为一个后端开发工程师，在Linux中查看查看文件内容是基本操作了。尤其是通常要分析日志文件排查问题，那么我们应该如何正确打开日志文件呢？对于笔者这种小菜鸡来说，第一反应就是 cat，tail，vi了，是的，我曾经用过好多次vim编辑器来查看日志文件。千万

citic 2020-02-22

如何手动将消息添加到Linux系统日志文件

日志文件是包含系统本身已记录的一组记录的文件。使用日志文件，系统管理员可以跟踪在特定日期或特定时间发生的情况。管理员通常将日志文件用于故障排除。日志文件是自动生成的，并保存在公共目录-/ var / log /下。我们还可以将消息手动添加到Linux系

xcznb 2020-02-11

Linux启动Spring boot项目命令

#不指定日志文件nohup java -jar csd-admin.jar --spring.profiles.active=prod & #指定日志文件nohup java -jar /projects/farinfo-csd/csd-ap

melonjj 2020-01-02

linux下logrotate 配置和理解 .

对于Linux 的系统安全来说，日志文件是极其重要的工具。系统管理员可以使用logrotate 程序用来管理系统中的最新的事件。logrotate 还可以用来备份日志文件，本篇将通过以下几部分来介绍。第三行weekly 指定所有的日志文件每周转储一次。第五

Lemonlemontree 2013-07-29

openwrt 下python程序后台运行，并将打印信息保存文件

"-u" 表示不启用缓存，实时输出打印信息到日志文件

codeAB 2019-12-24

linux后台启动springboot并指定日志文件名称

　　如果用nohup启动jar包的话，默认的日志文件就是nohup.out，那么如果启动多个jar包的话，看日志文件就麻烦了，因为他们都会写入到nohup.out文件中。[ ~]$ nohup java -jar dianyixia-0.0.1-SNAPS

xushxbigbear微信 2019-12-23

Linux——清除服务器的日志文件

无论多大的磁盘都遭不住日志文件的糟蹋啊,所以还是需要定时的清除一下。find / -name "*.log" -exec rm -rvf {} \;根据自己需要删除的日志进行修改即可。find / -name "nohup

thlm0 2019-12-08

Oracle归档模式和非归档模式

当第四个日志组满时，其就会切换到第一个日志组。同时，还必须使用SHUTDOWNNORMAL等命令关闭数据库。　　如现在Oracle数据库中有四个日志组，日志序列号分别为11、12、13、14。　　如当日志序列号为28时出现了数据文件的错误或者服务器硬盘损坏

zbcaicai 2019-12-06

sunnyhappy0

W3CSchool教程: HTML 教程; CSS 教程; Bootstrap 教程; Javascript 教程; jQuery 教程

后端教程: C 教程; Java 教程; PHP 教程; Python 教程; Go 教程

移动开发: Android 教程; Swift 教程; Kotlin 教程; jQuery Mobile 教程; ionic 教程

关于我们: 新闻动态; 联系方式; 招聘英才; 安科实验室; 帮助与反馈

安科网(Ancii)，中国第一极客网

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号京公网安备11010802014868号