十年風雨路 · 一心鑄精品

接一個官網 留一件精品 做一個項目 樹一塊樣板

關于shell命令的問題

想從網站日志中提取出,用戶的訪問記錄,不要搜索引擎的,命令怎么寫呢。使用python即可完美提取這是一般Apache的Log內容:192.168.1.1--[20/Nov/2011:01:10:35+0100]"GET/feed.atomHTTP/1.0"200259653192.168.1.2--[20/Nov/2011:01:10:49+0100]"GET/feed.atomHTTP/1.1"3041

時間:2014年07月02日 點擊量:

想從網站日志中提取出,用戶的訪問記錄,不要搜索引擎的,命令怎么寫呢。

 

使用python即可完美提取
這是一般Apache的 Log 內容:
192.168.1.1 - - [20/Nov/2011:01:10:35 +0100] "GET /feed.atom HTTP/1.0" 200 259653
192.168.1.2 - - [20/Nov/2011:01:10:49 +0100] "GET /feed.atom HTTP/1.1" 304 153
192.168.1.3 - - [20/Nov/2011:01:10:50 +0100] "GET /2008/1/23/no HTTP/1.0" 404 472
192.168.1.4 - - [20/Nov/2011:01:10:50 +0100] "GET /feed.atom?_qt=data HTTP/1.1"
先調出Log文件

with open('/var/log/apache2/access.log') as f:
for line in f:


然后提取用戶訪問記錄

import re
from collections import defaultdict
from heapq import nlargest

with open('log.txt') as f:
count = defaultdict(int)
for line in f:
    match = re.search(r' "\w+ (.*?) HTTP/', line)
    if match is None:
        continue
    uri = match.group(1).split('?')[0]
    count[uri] = count[uri] + 1

most_common = nlargest(5, count.items(), key=lambda x: x[1])
print most_common

推薦案例

  • 成都森美啦園林綠化工程公

  • 四川尚恒科技有限公司

  • 成都九邦物流有限責任公司

  • 四川品睿餐飲管理有限公司

  • 美繪陶社陶藝手繪工作室-暖

  • 成都恩多施生物工程技術有

  • 汶川羌人土特產有限公司

  • 印刷設計公司網站No.3138

聯系我們 / CONTACT US

  • 四川省成都市金牛區五福橋東路229號龍湖北城天街28棟903室
  • 服務熱線:400-000-2367 028-86088588
  • 總機:028-62322623-0
  • 傳真:028-62322623-823

掃碼訪問冠辰手機網站

版權所有 Copyright © 2002-2019 四川冠辰科技開發有限公司  www.mtlum.tw 保留所有權利  蜀ICP備11012605號

地址:四川省成都市金牛區五福橋東路229號龍湖北城天街28棟903室

服務熱線:400-000-2367 028-86088588 總機:028-62322623-0 傳真:028-62322623-823

捕鱼王游戏机 重庆时时开奖彩经网 pk10计划软件公式 北京pk10下载 广东时时开奖时间 时时彩后三6码 利赢棋牌游戏送10元 2期倍投 麻将技巧 6合app 真钱打鱼 名人彩票官方登录 竞彩足球胜平负计算器 足球看盘方法与技巧大全 时时彩龙虎玩法介绍 北京pk10怎么压最稳定 胆托投注金额对照表 重庆时时开奖彩经网 pk10计划软件公式 北京pk10下载 广东时时开奖时间 时时彩后三6码 利赢棋牌游戏送10元 2期倍投 麻将技巧 6合app 真钱打鱼 名人彩票官方登录 竞彩足球胜平负计算器 足球看盘方法与技巧大全 时时彩龙虎玩法介绍 北京pk10怎么压最稳定 胆托投注金额对照表