[操作疑難] python MuGo機械學習問題

本帖最後由 alke0613 於 2019-2-9 15:53 編輯

如題
我近日上網睇左tensorflow+純python的MuGo去搞個圍棋機械人
我用左4年棋局做preprocess+train
但係當我做到實戰它只係識得行4角+左至右上至下行
請問可以點搞

描述得唔算好清楚
不過個人覺得好大機率係旋積計算出現問題

TOP

本帖最後由 alke0613 於 2019-2-9 18:32 編輯


大約咁樣
就算的我點下棋都一樣,食左它都係咁
附件: 您需要登錄才可以下載或查看附件。沒有帳號?註冊

TOP

回覆 2# XML
咁我可以點檢查或解決?
thx

TOP

如題
我近日上網睇左tensorflow+純python的MuGo去搞個圍棋機械人
我用左4年棋局做preprocess+train
但係當 ...
alke0613 發表於 2019-2-9 15:48

此項目已於二零一七年中被放棄了,而取而代之是 MiniGO

via HKEPC IR Pro 3.5.2 - Android(3.1.2)

TOP

回復 5 #samiux

多謝!原來係咁

via HKEPC Reader for Android

TOP

呢個問題出於NN既錯誤
你可以試下轉用MCTS

TOP

回復 7 #XML
好似得左!但有bug要慢慢trace
唔該晒!有問題我再問

via HKEPC Reader for Android

TOP

回覆 7# XML
現在我用MCTS會出BUG
raise IllegalMove()
go.IllegalMove
github似乎無解決方法
請問可以點搞,THX!
附件: 您需要登錄才可以下載或查看附件。沒有帳號?註冊

TOP

回覆  XML
現在我用MCTS會出BUG
raise IllegalMove()
go.IllegalMove
github似乎無解決方法
請問可以點搞, ...
alke0613 發表於 2019-2-11 14:36

我並無深入硏究這個 MuGo 項目,但從「讀我」檔得知,這項目用的是「監管模式」(supervise) 來進行。但真正的 AlphaGo 或者 AlphaGo Zero 是用「加強模式」(reinforcement) 來進行。我想「監管模式」在這個場景是不太適合吧。

via HKEPC IR Pro 3.5.2 - Android(3.1.2)

TOP