web driver?

TOP

很奇怪, 為甚麼大家都喜歡用 SSR

疫情嚴重, 大家分散在家工作, 公司成本減少, 不是更好 ?

TOP

回覆  KinChungE
例如商品類的話,有做SEO的可以輕鬆read meta

冇的話只能靠DOM,例如某id/div內的第n個e ...
Rolf 發表於 2020-7-25 21:03


有時唔係冇API, 而係API要俾錢

另外, 例如我想mon住hktvmall某D商品幾時減價, 呢D會俾API你嗎?

TOP

回覆 13# KinChungE
HKTVMALL好似唔係SPA? 冇用過冇研究

我指的API唔係官方開放有哂document嗰類
而係做得SPA網頁,或多或少一定要開放一啲public的API Endpoint
原意係俾佢自己web app用,唔預你直接call,更可能會有少少防護機制

所以先話要自己研究
你研究到佢call的request方式,你就可以用

TOP

回覆  KinChungE
HKTVMALL好似唔係SPA? 冇用過冇研究

我指的API唔係官方開放有哂document嗰類
而係做得SP ...
Rolf 發表於 2020-7-25 22:41


寫得crawler既, 9成都係專登crawl D人地唔預你拎既野

TOP

回覆 15# KinChungE
Yes
好似股票報價API咁,官方就緊係要俾錢
但搵啲第三方SPA網,就可以偷偷地用佢API(當然要再做啲嘢,直接call唔到)
一般List data類API都唔會話保安好嚴密,有心試實試到

而家除咗Crawl傳統網頁或冇SSR的SPA,我一般都直接研究佢API拎
Data靚仔直接用
係DOM拎又煩又易拎錯嘢,又要再加logic check,check完又唔一定100%準,好多仲要冇得check(如plain text類)
人地一改頁面,DOM structure 一唔同,DB就一咋垃圾data要清,諗起都怕

TOP

好似未有人答到我

TOP

回覆 17# sobad
要效能,要速度一定係自己寫code
用現成tools限制多,未必啱自己需要,更有可能要俾錢
揀隻多平台language就可以了,例如go/node等

TOP

python + bs4

TOP

回覆 18# Rolf

但係我個四款都係自己寫code , base on python/javascript喎

TOP