十年風雨路 · 一心鑄精品

接一個官網 留一件精品 做一個項目 樹一塊樣板

關于shell命令的問題

想從網站日志中提取出,用戶的訪問記錄,不要搜索引擎的,命令怎么寫呢。使用python即可完美提取這是一般Apache的Log內容:192.168.1.1--[20/Nov/2011:01:10:35+0100]"GET/feed.atomHTTP/1.0"200259653192.168.1.2--[20/Nov/2011:01:10:49+0100]"GET/feed.atomHTTP/1.1"3041

時間:2014年07月02日 點擊量:

想從網站日志中提取出,用戶的訪問記錄,不要搜索引擎的,命令怎么寫呢。

 

使用python即可完美提取
這是一般Apache的 Log 內容:
192.168.1.1 - - [20/Nov/2011:01:10:35 +0100] "GET /feed.atom HTTP/1.0" 200 259653
192.168.1.2 - - [20/Nov/2011:01:10:49 +0100] "GET /feed.atom HTTP/1.1" 304 153
192.168.1.3 - - [20/Nov/2011:01:10:50 +0100] "GET /2008/1/23/no HTTP/1.0" 404 472
192.168.1.4 - - [20/Nov/2011:01:10:50 +0100] "GET /feed.atom?_qt=data HTTP/1.1"
先調出Log文件

with open('/var/log/apache2/access.log') as f:
for line in f:


然后提取用戶訪問記錄

import re
from collections import defaultdict
from heapq import nlargest

with open('log.txt') as f:
count = defaultdict(int)
for line in f:
    match = re.search(r' "\w+ (.*?) HTTP/', line)
    if match is None:
        continue
    uri = match.group(1).split('?')[0]
    count[uri] = count[uri] + 1

most_common = nlargest(5, count.items(), key=lambda x: x[1])
print most_common

推薦案例

  • 成都森美啦園林綠化工程公

  • 四川尚恒科技有限公司

  • 成都九邦物流有限責任公司

  • 四川品睿餐飲管理有限公司

  • 美繪陶社陶藝手繪工作室-暖

  • 成都恩多施生物工程技術有

  • 汶川羌人土特產有限公司

  • 印刷設計公司網站No.3138

聯系我們 / CONTACT US

  • 四川省成都市金牛區五福橋東路229號龍湖北城天街28棟903室
  • 服務熱線:400-000-2367 028-86088588
  • 總機:028-62322623-0
  • 傳真:028-62322623-823

掃碼訪問冠辰手機網站

版權所有 Copyright © 2002-2019 四川冠辰科技開發有限公司  www.mtlum.tw 保留所有權利  蜀ICP備11012605號

地址:四川省成都市金牛區五福橋東路229號龍湖北城天街28棟903室

服務熱線:400-000-2367 028-86088588 總機:028-62322623-0 傳真:028-62322623-823

捕鱼王游戏机 乒乓球拍横拍和直拍的区别 欧亿彩票苹果 上海快三走势图和值 排列三走势图500w 东东萍象棋棋谱仓库 365足球比分网 手机彩票app下载 母婴用品跟童装哪个赚钱 好运彩3历史记录 百赢棋牌官网版 真人斗地主赢现金 雪缘园北京单场比分 超级大乐透 比特快车赚钱挂机 北京pk10走势图软件 福建时时彩开奖结果 乒乓球拍横拍和直拍的区别 欧亿彩票苹果 上海快三走势图和值 排列三走势图500w 东东萍象棋棋谱仓库 365足球比分网 手机彩票app下载 母婴用品跟童装哪个赚钱 好运彩3历史记录 百赢棋牌官网版 真人斗地主赢现金 雪缘园北京单场比分 超级大乐透 比特快车赚钱挂机 北京pk10走势图软件 福建时时彩开奖结果