2017年2月21日 星期二

[Tensorflow] 以Intel Vtune amplifier 對 Tensorflow 分散式學習 Profiling

硬體配置 - 4台PC  負責運算的worker 上面各有2張 NVIDIA 的 GTX 1080

我以負責其中一台 node0 當作 parameter server

Analysis Target

Application : /usr/bin/python  #填入執行 python 的 binary 所在位置

Application parameters : /home/paslab/workspace/benchmark/tensorflow/exercise-01/example.py python example.py --job_name="ps" --task_index=0  #這邊相當於填入command line裡面的內容,我們在這邊輸入要profile程式的位置,接下來在輸入執行 python 訓練程式所在的位置

Working Directory : 選擇你要把分析完的結果存放在那理

Analysis Type

選擇自己需要的分析方式


以上都填寫正確並選擇完畢之後

按下 start 之後,如果一切正確,就可以看到分散式訓練順利的開始執行,如下圖一所示


圖一、VTune 成功執行分散式運算

表示 VTune 開始執行該支程式並開始 Profiling

沒有留言:

張貼留言

/* 載入prettify的autoloader */ /* 載入JQuery */