如何filter走D bot?

我有個網站想計下人流

咁我係php最開頭記錄低, $_SERVER['HTTP_USER_AGENT'], 同埋ip

但後來發現好多都係bot, 咁我再加多個if, check到有個bot字, 就唔記錄

但又發現好多無個bot字的bot, 仲有好多都唔肯定係唔係bot的記錄

咁樣統計資料就好唔準, 有無辦法可以filter走, 唔記錄非真正user的request?


除此之外, 我仲發現好多非page的request, 例如
/apple-touch-icon.png
/favicon.ico


又係會另到個結果多左好幾倍, 有無方法避免?

用google analytics...完

TOP

未完, 因為唔可以比user見到係client side的code加多左樣野, 所以唔work

TOP

google analytics係國內係廢的.

TOP

Frontend 可以考慮 Augluar / React 之類或 Ajax 做 async API call, 之後個 analytics 喺 API Level 度做,bots / scraper / spiders 唔會走去 call 你個 api

TOP

或者講清楚少少, 個網站係記念一個網站而整出黎的復刻網站
一開始已經應承user係100%還原, 所以client side一係個js function都唔可以加
莫講話js function, 就連1px的img都唔得
所以任何js solution都唔岩用

TOP

google analytics係國內係廢的.
dllm2048 發表於 2017-7-25 16:40


Google analytics廢咪用Baidu tongji囉..

TOP

You can install analytics software in your server. Like https://piwik.org

TOP

未完, 因為唔可以比user見到係client side的code加多左樣野, 所以唔work
3ldk 發表於 2017-7-25 15:23



    pure server side 要用 ml 做呀.......
你識唔識寫 ml? 個客俾唔俾得起錢做 ml?

TOP

本帖最後由 梁炳 於 2017-7-25 21:34 編輯

有無咁高technical要求...加少少睇唔到既野都唔得?
咁你等於自己寫個analytics出來
建議你乜都紀錄左先,之後先用program再set rules刨logs
用Apache既話,應該有現成工具識讀log,甚至自動gen report,唔用Apache就...自己搵下啦
你真係想自己用PHP code dup出來既話,祝你好運...

除非你係公司內部網站,有特定client要求 (e.g. 打算用Windows 95+IE5來用),咁無得講
否則放出街既網,我諗唔到點解唔可以加個簡單google analytics...

TOP