十年風雨路 · 一心鑄精品

接一個官網 留一件精品 做一個項目 樹一塊樣板

關于shell命令的問題

想從網站日志中提取出,用戶的訪問記錄,不要搜索引擎的,命令怎么寫呢。使用python即可完美提取這是一般Apache的Log內容:192.168.1.1--[20/Nov/2011:01:10:35+0100]"GET/feed.atomHTTP/1.0"200259653192.168.1.2--[20/Nov/2011:01:10:49+0100]"GET/feed.atomHTTP/1.1"3041

時間:2014年07月02日 點擊量:

想從網站日志中提取出,用戶的訪問記錄,不要搜索引擎的,命令怎么寫呢。

 

使用python即可完美提取
這是一般Apache的 Log 內容:
192.168.1.1 - - [20/Nov/2011:01:10:35 +0100] "GET /feed.atom HTTP/1.0" 200 259653
192.168.1.2 - - [20/Nov/2011:01:10:49 +0100] "GET /feed.atom HTTP/1.1" 304 153
192.168.1.3 - - [20/Nov/2011:01:10:50 +0100] "GET /2008/1/23/no HTTP/1.0" 404 472
192.168.1.4 - - [20/Nov/2011:01:10:50 +0100] "GET /feed.atom?_qt=data HTTP/1.1"
先調出Log文件

with open('/var/log/apache2/access.log') as f:
for line in f:


然后提取用戶訪問記錄

import re
from collections import defaultdict
from heapq import nlargest

with open('log.txt') as f:
count = defaultdict(int)
for line in f:
    match = re.search(r' "\w+ (.*?) HTTP/', line)
    if match is None:
        continue
    uri = match.group(1).split('?')[0]
    count[uri] = count[uri] + 1

most_common = nlargest(5, count.items(), key=lambda x: x[1])
print most_common

推薦案例

  • 成都森美啦園林綠化工程公

  • 四川尚恒科技有限公司

  • 成都九邦物流有限責任公司

  • 四川品睿餐飲管理有限公司

  • 美繪陶社陶藝手繪工作室-暖

  • 成都恩多施生物工程技術有

  • 汶川羌人土特產有限公司

  • 印刷設計公司網站No.3138

聯系我們 / CONTACT US

  • 四川省成都市金牛區五福橋東路229號龍湖北城天街28棟903室
  • 服務熱線:400-000-2367 028-86088588
  • 總機:028-62322623-0
  • 傳真:028-62322623-823

掃碼訪問冠辰手機網站

版權所有 Copyright © 2002-2019 四川冠辰科技開發有限公司  www.mtlum.tw 保留所有權利  蜀ICP備11012605號

地址:四川省成都市金牛區五福橋東路229號龍湖北城天街28棟903室

服務熱線:400-000-2367 028-86088588 總機:028-62322623-0 傳真:028-62322623-823

捕鱼王游戏机 赌场 玩龙虎的个人经验 飞鸟派对爆分 法甲主场积分榜 淘宝老号怎么做的 统一开奖为何会输 吉林时时票平台 七乐彩的玩法 上海时时查结果 奖聊走势图吉林快三 老时时彩带线走势图 篮彩胜分差怎么买 时时走势图分析技巧 快乐12任5遗漏数据 重庆时时彩是正规的吗? 黑龙江时时介绍 赌场 玩龙虎的个人经验 飞鸟派对爆分 法甲主场积分榜 淘宝老号怎么做的 统一开奖为何会输 吉林时时票平台 七乐彩的玩法 上海时时查结果 奖聊走势图吉林快三 老时时彩带线走势图 篮彩胜分差怎么买 时时走势图分析技巧 快乐12任5遗漏数据 重庆时时彩是正规的吗? 黑龙江时时介绍