014559
katago-v1.12.2の特徴
katago-v1.11.0のcuda及びopclとkatago-v1.12.2のcuda及びopclを1手5秒で双方40bのS1184を使用して各100戦づつさせた

v1.11.0cuda 53-47  v1.12.2cuda GPU RTX3070
v1.11.0 opcl 31-69  v1.12.2 opcl GPU RTX3070 添付画像参照

最初のエンジン((CUDA)Kata1110-40S1184):
全体での勝ち数 : 53 黒番での勝ち数 : 26 白番での勝ち数: 27 トータル消費時間 51735.215 秒 トータル訪問数: 110135280
2番目のエンジン((CUDA)Kata1122-40S1184):
全体での勝ち数 : 47 黒番での勝ち数 : 23 白番での勝ち数: 24 トータル消費時間 51798.754 秒 トータル訪問数: 111561457

最初のエンジン((OpCL)Kata1110-40S1184):
全体での勝ち数 : 31 黒番での勝ち数 : 16 白番での勝ち数: 15 トータル消費時間 51796.26 秒 トータル訪問数: 76289389
2番目のエンジン((OpCL)Kata1122-40S1184):
全体での勝ち数 : 69 黒番での勝ち数 : 35 白番での勝ち数: 34 トータル消費時間 51970.016 秒 トータル訪問数: 145959092

対局結果詳細をチェックするとcudaではトータル訪問数にほとんど差がないがopclではv1.12.2のトータル訪問数が2倍近い
v1.12.2opclはRTX3070でスピードアップしているようだ

日頃Lizzieyzyを使用されている方からkatagoのv1.11.0opcl(40S1184)とv1.12.2opcl(40S1184)を1手5秒で10戦(所要時間3時間程度)
又は20戦させた結果報告を募集します よろしくお願いします

追記 Ebaさんへ ご協力ありがとうございました スレがどんどん縦長になるので追記で書きました
勝敗の内訳とともにトータル訪問数の結果報告もお願いします 棋譜保存フォルダの中の対局結果のTXTファイルに記録されてます

追記2 Ebaさんへ トータル訪問数の結果報告ありがとうごさいました

odagaki0621 2023/01/16(Mon) 10:38 No.326  記事編集
Re: katago-v1.12.2の特徴
エンジン同士の多くのゲームの検証は気が向かないのでやりませんが、代わりにベンチマークテストの結果をお知らせします。

1.11.0 opcl s118

2023-01-16 17:24:02+0900: OpenCL backend thread 0: Model version 10
2023-01-16 17:24:02+0900: OpenCL backend thread 0: Model name: kata1-b40c256-s11840935168-d2898845681
2023-01-16 17:24:04+0900: OpenCL backend thread 0: FP16Storage true FP16Compute false FP16TensorCores true

numSearchThreads = 5: 10 / 10 positions, visits/s = 270.74 nnEvals/s = 235.83 nnBatches/s = 95.03 avgBatchSize = 2.48 (14.9 secs)
numSearchThreads = 12: 10 / 10 positions, visits/s = 339.32 nnEvals/s = 309.10 nnBatches/s = 52.83 avgBatchSize = 5.85 (12.1 secs)
numSearchThreads = 10: 10 / 10 positions, visits/s = 322.05 nnEvals/s = 287.56 nnBatches/s = 58.71 avgBatchSize = 4.90 (12.7 secs)
numSearchThreads = 20: 10 / 10 positions, visits/s = 360.45 nnEvals/s = 339.49 nnBatches/s = 34.59 avgBatchSize = 9.82 (11.6 secs)
numSearchThreads = 8: 10 / 10 positions, visits/s = 307.48 nnEvals/s = 271.08 nnBatches/s = 69.31 avgBatchSize = 3.91 (13.2 secs)
numSearchThreads = 16: 10 / 10 positions, visits/s = 341.86 nnEvals/s = 320.00 nnBatches/s = 40.90 avgBatchSize = 7.82 (12.1 secs)


1.12.2 opcl s118

2.2-opencl/KataGoData/opencltuning/tune10_gpuNVIDIAGeForceRTX2060_x19_y19_c256_mv10.txt
2023-01-16 17:27:35+0900: OpenCL backend thread 0: Model version 10
2023-01-16 17:27:35+0900: OpenCL backend thread 0: Model name: kata1-b40c256-s11840935168-d2898845681
2023-01-16 17:27:36+0900: OpenCL backend thread 0: FP16Storage true FP16Compute false FP16TensorCores false FP16TensorCoresFor1x1 false

numSearchThreads = 5: 10 / 10 positions, visits/s = 187.05 nnEvals/s = 162.14 nnBatches/s = 65.35 avgBatchSize = 2.48 (21.6 secs)
numSearchThreads = 12: 10 / 10 positions, visits/s = 235.26 nnEvals/s = 212.57 nnBatches/s = 36.37 avgBatchSize = 5.85 (17.4 secs)
numSearchThreads = 10: 10 / 10 positions, visits/s = 225.30 nnEvals/s = 200.23 nnBatches/s = 40.97 avgBatchSize = 4.89 (18.1 secs)
numSearchThreads = 20: 10 / 10 positions, visits/s = 253.79 nnEvals/s = 237.42 nnBatches/s = 24.21 avgBatchSize = 9.81 (16.4 secs)
numSearchThreads = 8: 10 / 10 positions, visits/s = 216.02 nnEvals/s = 192.22 nnBatches/s = 48.81 avgBatchSize = 3.94 (18.8 secs)
numSearchThreads = 16: 10 / 10 positions, visits/s = 246.01 nnEvals/s = 227.14 nnBatches/s = 29.05 avgBatchSize = 7.82 (16.8 secs)

1.12.2は1.11.0より大幅に速度が遅いので、多くのゲームを行えば1.12.2が大きく負け越すと思います。
discordでも私と同様の報告がありますので、1.12.2-opcl版の改善版が出ることを期待しています。
odagaki0621さんは、私とは逆のようですが、
1.11.0のFP16Storage true FP16Compute false FP16TensorCores trueと、
1.12.2のFP16Storage true FP16Compute false FP16TensorCores false FP16TensorCoresFor1x1 falseはどのようになっていますか?
hope366   2023/01/16(Mon) 17:35 No.328 記事編集
Re: katago-v1.12.2の特徴
LizzieYzy《エンジン同士の対戦》の連続対局10でやってみました。(https://www.h-eba.com/Lizzie/LizzieYzy/submanual.html#yzy1
(KataGo v1.12.2 OpenCL 40B s-118) vs (KataGo v1.11.0 OpenCL 40B s-118)
1手5秒、日本ルール、numSearchThreads = 32、GPUはRTX2080
1戦ごとに先後を換えて10戦した結果は
KataGo v1.11.0 OpenCL 40B s-118 の7勝3敗でした。

hope366さんの言われるFP16が有効になっているかはどこで判断できるのでしょうか?
default_gtp.cfgには
# openclUseFP16 = auto とコメントアウトされたままで双方対戦しています。
Eba   2023/01/16(Mon) 20:54 No.329 記事編集
Re: katago-v1.12.2の特徴
FP16関連については、LizzieYzyでエンジンをロードした時にGTPコンソールに表示されると思っていたのですが、今確認してみたら表示されていませんでした。
ベンチマークテストでは表示されています。上の私の書き込みから引用します。

1.11.0 opcl s118

2023-01-16 17:24:04+0900: OpenCL backend thread 0: FP16Storage true FP16Compute false FP16TensorCores true

「FP16TensorCores true」とありますので有効になっています。

1.12.2 opcl s118

2023-01-16 17:27:36+0900: OpenCL backend thread 0: FP16Storage true FP16Compute false FP16TensorCores false FP16TensorCoresFor1x1 false

「FP16TensorCores false 」こちらは無効です。
「FP16TensorCoresFor1x1 false」も似たような意味合いだと思いますが詳しくは分かりません。

Ebaさんの環境での対戦結果が、1.11.0側から見て7勝3敗となっていますので、私の場合と同じでFP16TensorCoresに関して1.11.0で有効、1.12.2では無効になっているのではないかと思います。
hope366   2023/01/16(Mon) 22:03 No.330 記事編集
Re: katago-v1.12.2の特徴
久しぶりにベンチマークテストをしました(懐かしい(笑)
https://www.h-eba.com/Lizzie/LizzieYzy/submanual.html#yzy6

katago v1.11.0は
FP16Storage true FP16Compute false FP16TensorCores true

katago v1.12.2は
FP16Storage true FP16Compute false FP16TensorCores true FP16TensorCoresFor1x1 false
でした。
Eba   2023/01/16(Mon) 23:06 No.331 記事編集
Re: katago-v1.12.2の特徴
ついでにkatago v1.12.2の18blocksネットについてもやってみました。
LizzieYzy《エンジン同士の対戦》の連続対局10。(https://www.h-eba.com/Lizzie/LizzieYzy/submanual.html#yzy1
(KataGo v1.12.2 OpenCL 18B-uec) vs (KataGo v1.11.0 OpenCL 40B s-118)
1手5秒、日本ルール、numSearchThreads = 32、GPUはRTX2080
1戦ごとに先後を換えて10戦した結果は
KataGo v1.12.2 OpenCL 18B-uec の8勝2敗でした。
次はOpenCLとTensorRTとを比較してみます。
Eba   2023/01/17(Tue) 15:50 No.332 記事編集
Re: katago-v1.12.2の特徴
1.11.0側から見て7勝3敗とのことでしたので、1.12.0のFP16TensorCoreがfalseを予想していたのですが、trueのようですね。
ということは1.11.0と1.12.2はほぼ同じ速度、のような気がします。

odagakiさんの場合は1.11.0が遅くて1.12.2が速い。
私は逆で、1.11.0が速くて1.12.2が遅い。
Ebaさんは数値が記述されてないのではっきりしませんが、おそらく両方速いのだろうと思います。
3パターンどれも同じものがないというのは意外です。
hope366   2023/01/17(Tue) 18:16 No.333 記事編集
Re: katago-v1.12.2の特徴
私の推測ですがv1.12opclの開発チームはRTX3090機で開発を進めてRTX2000シリーズやGTX1000シリーズ等まで手が回らなかったのでは
ないかと思います 実際 私のGTX1060(3G)機ではv1.11.0opclがv1.12.2opclに かなり優勢です 次のバージョンに期待するという事で
この件は打ち切ります 皆さんご迷惑をおかけしました
odagaki0621   2023/01/17(Tue) 19:37 No.334 記事編集
Re: katago-v1.12.2の特徴
上記の10戦した総訪問数です。
katago v1.11.0 OpenCL 40b = 14,789,399
katago v1.12.2 OpenCL 40b = 10,396,001

katago v1.12.2 OpenCL 18b = 12,101,092
katago v1.12.2 OpenCL 40b = 14,687,282
Eba   2023/01/17(Tue) 19:40 No.335 記事編集
Re: katago-v1.12.2の特徴
予想通り1.11.0-opclと1.12.2-opclがほぼ同じ感じですね。
Ebaさんの2080では高速なのに私の2060だと遅くなるのは少し損した気分です(笑)
discordでもOpenCL版に関して似たような書き込みがあって、修正版が出るのを少し待っていたのですが、出そうな気配が無さそうなので、Lizzie改良版とLizzieYzyにKataGo-v1.12.2と18Bネットを適用してリリースしようと思います。
hope366   2023/01/17(Tue) 23:00 No.336 記事編集
量子コンピュータでも解読困難な暗号技術
量子コンピュータでも解読困難。宇宙線ミュー粒子を用いた暗号通信技術
https://pc.watch.impress.co.jp/docs/news/1470499.html

>東京大学国際ミュオグラフィ連携研究機構は13日、ミュー粒子を用いた高セキュリティワイヤレス技術「COSMOCAT」を開発したと発表した。
odagaki0621 2023/01/16(Mon) 16:56 No.327  記事編集
katago-v1.12.0opclの特徴
katago-v1.11.0opclとkatago-v1.12.0opclを1手5秒で双方40bのS1184を使用して異なるGPUで各100戦づつさせた

v1.11.0opcl 52-48 v1.12.0opcl GPU GTX1060(3G)
v1.11.0opcl 27-73 v1.12.0opcl GPU RTX3070 添付画像参照 (画像は100戦目の終盤)

対局結果詳細をチェックするとGTX1060(3G)ではトータル訪問数にほとんど差がないがRTX3070ではv1.12.0opclが2倍近く出ていた
v1.12.0opclはRTX3070でスピードアップするように最適化されているように感じた

追記 記事を修正しました

odagaki0621 2023/01/12(Thu) 11:28 No.323  記事編集
Re: katago-v1.12.0opclの特徴
OpenCL版が高速になるかどうかは、FP16 TensorCoreが有効になるかどうかで決まると思いますが、私のRTX2060では残念ながら有効にならず、CUDA版の約半分の速度しかでていません。
CUDA版とTensorRT版はFP16 Tensor Coreが有効になっている為高速です。
CUDA版はOpenCL版の約2倍、TensorRT版はOpenCL版の約3倍の速度がでています。
KataGo-v1.5.0でOpenCL版のFP16 Tensor Coreが有効になった時は、OpenCL版はCUDA版と同様に高速でしたが、最近のKataGoは高速になりません。
hope366   2023/01/12(Thu) 18:12 No.324 記事編集
相手を倒すのではなくジゴを狙うKataJigo
相手を倒すのではなくジゴを狙うkatagoと対戦。
https://github.com/yishn/KataJigo
https://github.com/yishn/KataJigo/releases/tag/v1.0.2
odagaki0621 2023/01/04(Wed) 13:05 No.312  記事編集
Re: 相手を倒すのではなくジゴを狙うKataJigo
odagaki0621さん、面白そうなエンジンの紹介をありがとうございます。
使えそうならここでも紹介しようと思います。
Eba   2023/01/04(Wed) 14:58 No.313 記事編集
Re: 相手を倒すのではなくジゴを狙うKataJigo
katajigo.exeを最新のKataGoフォルダにおいて実行したらエラーになりました。
katajigoの最新のリリースが2020年の3月なので、それ以前のKataGoで最も新しいkatago-v1.3.3を持ってきて、このフォルダにkatajigo.exeをおいて、設定ファイルもこのフォルダの中にあるgtp_example.cfgを使用し、さらにweightファイルも2020年3月以前で最新の20ブロックs243を使用したら動きました。
といっても分析モードでは動作せず、対局モードでのみ動きました。
うまく手加減をしてくれているようで、どの局面でも形勢が五分五分くらいになっているようです。

weightファイルはkata1シリーズ以降はNGで、それ以前の最強である40ブロックs509は動きました。
hope366   2023/01/04(Wed) 16:10 No.314 記事編集
Re: 相手を倒すのではなくジゴを狙うKataJigo
hope366さん、検証していただきありがとうございます。
かなり前のものですし、一般ユーザーが簡単には動かせないかもしれませんね。
ここで紹介するのは開発が再開されたら考えることに致します。
Eba   2023/01/04(Wed) 21:12 No.315 記事編集
Re: 相手を倒すのではなくジゴを狙うKataJigo
318KaTrainならAI対局の棋風選択でkatajigoがあるようです。
bunbun   2023/01/09(Mon) 16:01 No.318 記事編集
Re: 相手を倒すのではなくジゴを狙うKataJigo
KaTrainを忘れていました。なるほど。
教えていただきありがとうございます。
Eba   2023/01/09(Mon) 17:50 No.319 記事編集
Re: 相手を倒すのではなくジゴを狙うKataJigo
KaTrainのKata碁持をLeelaGUIのKataGoとLeela0.11.0相手に両方白番で対戦させました
棋力が遥かに離れている2種類のエンジン相手に見事に両方0.5目差で負けてくれました
odagaki0621   2023/01/11(Wed) 14:15 No.320 記事編集
Re: 相手を倒すのではなくジゴを狙うKataJigo
それは良かったです。
私も自身でkatajigoで対局しましたが面白かった記憶があります。
KaTrainは棋風などを選べるので楽しいですよね。
bunbun   2023/01/11(Wed) 22:57 No.321 記事編集
GeForce RTX 4070 Ti 正式発表
旧「GeForce RTX 4080 12GB」が「GeForce RTX 4070 Ti」として正式発表
>米NVIDIAは4日(現地時間)、ハイエンドGPU「GeForce RTX 4070 Ti」を発表した。5日にも販売が開始される予定
>旧世代と比較すると、DLSS 3といった新技術に対応し、フレーム補間を行なうことで従来のGeForce RTX 3090 Tiをも上回る性能を達成できる
https://pc.watch.impress.co.jp/docs/news/1467478.html
odagaki0621 2023/01/04(Wed) 10:00 No.311  記事編集
RTX 4070 Tiをベンチマーク
市場想定価格799ドルの高性能GPU「GeForce RTX 4070 Ti」をベンチマーク
https://pc.watch.impress.co.jp/docs/column/hothot/1467730.html
odagaki0621   2023/01/05(Thu) 21:47 No.316 記事編集
RTX 4070 Tiが各社から登場
GeForce RTX 4070 Tiが各社から登場、最安モデルは149,000円
https://akiba-pc.watch.impress.co.jp/docs/news/news/1468314.html

追記 ELSA「GeForce RTX 4070 Ti ERAZOR」が発売、2スロット厚クーラー採用
https://akiba-pc.watch.impress.co.jp/docs/news/news/1469520.html
odagaki0621   2023/01/06(Fri) 16:52 No.317 記事編集

- Joyful Note -
- Smart Board Type-G v2.1 -
++ Edited by TRANSFORM ++