WIN10安裝TENSORFLOW(GPU版本)詳解(超詳細(xì),從零開始)
時間:2023-04-21 13:12:01 | 來源:網(wǎng)站運營
時間:2023-04-21 13:12:01 來源:網(wǎng)站運營
WIN10安裝TENSORFLOW(GPU版本)詳解(超詳細(xì),從零開始):
更新日期 2020年1月2日
更新內(nèi)容:
添加CUDDN的另一種安裝方法。
我安裝TENSORFLOW的時候走了很多彎路,入了很多坑,所以特此寫下攻略希望能幫助到更多小白。流程如如下。
安裝前:請先安裝ANACONDA,對于WINDOWS來說還是用ANACONDA來安裝比較方便一些。安裝好ANACONDA后,要添加環(huán)境:
接下來開始安裝TENSORFLOW。
第一步,
確定你的安裝類型:1)支持GPU類型,還是2)CPU類型
【一般如果做深度學(xué)習(xí),最好安裝GPU類型,因為運算速度更快】
第二步,
如果是CPU類型,按照官網(wǎng)的說法一步一步來就行了。
如果是GPU類型,首先需要查看自己電腦的GPU型號,步驟如下。
然后用谷歌搜索“你的GPU型號+SPECIFICATION”,在官網(wǎng)查它是否支持CUDA
第三步,
安裝CUDA重要的事情說三遍:
請看清楚你需要的TENSORFLOW型號,以及它需要的環(huán)境!
請看清楚你需要的TENSORFLOW型號,以及它需要的環(huán)境!
請看清楚你需要的TENSORFLOW型號,以及它需要的環(huán)境!
有人問在哪里看型號,這個在TENSORFLOW的官網(wǎng)上可以查到的,稍微動動手就能找到了。如下圖所示
如果你是需要跑某一個特定程序,那么它可能在特定的TENSORFLOW版本下才運行良好。而每一個版本對應(yīng)的所需環(huán)境都不一樣。一定要嚴(yán)格按照規(guī)定來安裝。
以TENSORFLOW1.0來說,你需要安裝CUDA? 工具包 9.0和cuDNN v7.0。
====更新內(nèi)容(2020年1月2日)=====
我最近一次安裝,安裝了tensorflow_gpu-1.14.0, 以這個為標(biāo)準(zhǔn),我搭配了python 3.6, cuDNN7.4, 和CUDA10.0, 注意,在tensorflow官網(wǎng)上都不會寫清楚CUDA版本的小數(shù)點位。我在網(wǎng)上看了一下別人的答案,說是tensorflow_gpu-1.14.0和CUDA10.0最匹配,安裝10.1或者10.2可能有不兼容的風(fēng)險。
==========================
鑒于有太多伸手黨問我版本查詢的鏈接,我就貼在這里吧~
https://www.tensorflow.org/install/source_windows【下面是坑】
以2018年5月20日為基準(zhǔn),此時你登錄CUDA官網(wǎng)直接下載的時候,首頁默認(rèn)下載下來的是CUDA 9.2, 這樣當(dāng)你全部安裝完的時候會發(fā)現(xiàn)TENSORFLOW1.0跟他不兼容。所以一定要下載9.0版本。這個版本需要你自己單獨點到
CUDA Toolkit Archive里去找出來。
安裝好后,打開anaconda的terminal輸入
nvcc -V
進(jìn)行測試,如果顯示如下,證明你安裝成功了。
第四步,
安裝cuDNN去官網(wǎng)下載CUDNN 7.0,同前,
注意型號。下載CUDNN需要去官網(wǎng)注冊一個什么東西,總之需要注意版本就好?!疚蚁螺d的是CUDNN7.0.5, 只要在7.x.x 版本范圍內(nèi)都可以】,下載下來的CUDNN是一個壓縮包,解壓以后,把以下內(nèi)容添加到環(huán)境里面去。
添加環(huán)境
接著是CUDNN的安裝:
首先在
命令窗口中
進(jìn)入你安裝CUDNN的那個文件夾,進(jìn)入之后,開啟bash模式(win10自帶的bash,直接輸入bash就行了,如果bash出問題,那可以再windows store里面下載一個ubuntu for windows,當(dāng)然這里也有別的cudnn的安裝方法,這里我只是寫了一個我個人的喜好方式。)
然后輸入
cat include/cudnn.h | grep CUDNN_MAJOR -A 2
如果顯示如下圖就說明安裝成功
檢查完輸入exit退出bash模式
====更新內(nèi)容(2020年1月2日)===
以下是另一種安裝方法,適用于無法成功安裝ubuntu for windows,或者公司電腦不給windows store開放權(quán)限的。
下載CUDNN后,復(fù)制粘貼cuDNN里面的下面三個文件到CUDA的相應(yīng)同名文件
- cudnn/cuda/bin => CUDA/v10.0/bin
- cudnn/cuda/include => CUDA/v10.0/include
- cudnn/lib/x64 => CUDA/v10.0/lib/x64
下圖是一個示意圖,詳情請見CSDN的這篇帖子。
第五步接下來開始用ANACONDA安裝TENSORFLOW,
1)在ANACONDA里創(chuàng)建名為TENSORFLOW的環(huán)境(你可以叫他任何名字,這里我叫這個環(huán)境為TENSORFLOW。
conda create -n tensorflow pip python=3.6
這里pip python=3.6的意思是在名為tensorflow的環(huán)境里搭建版本是3.6的python。
2)發(fā)出以下命令以激活 conda 環(huán)境:
activate tensorflow3)發(fā)出相關(guān)命令以在 conda 環(huán)境中安裝 TensorFlow。請輸入以下命令:
(tensorflow)C:>
pip install --ignore-installed --upgrade tensorflow-gpu假如你想安裝某個特定版本的tensorflow,可以輸入如下命令,根據(jù)自己的喜好,替代那個1.8.0即可:
pip install --ignore-installed --upgrade tensorflow_gpu==1.8.0
4)測試是否安裝成功
在ANACONDA窗口的tensorflow的環(huán)境中,跑一個test.py,看是否能運行成功。
如下圖,得到了“Hello World”證明一切安裝順利。
test.py的內(nèi)容如下
import tensorflow as tf# Create TensorFlow object called tensorhello_constant = tf.constant('Hello World!')with tf.Session() as sess: # Run the tf.constant operation in the session output = sess.run(hello_constant) print(output.decode())# bytestring decode to string.
以上就是全部安裝內(nèi)容啦?。?!撒花。
------2018年5月23日更新------
經(jīng)知友提示,上述test.py代碼只是檢測了tensorflow是否安裝成功。
如果想要
檢測tensorflow的確用gpu來做運算了,請用以下腳本測試
import tensorflow as tf# Creates a graph.a = tf.constant([1.0, 2.0, 3.0, 4.0, 5.0, 6.0], shape=[2, 3], name='a')b = tf.constant([1.0, 2.0, 3.0, 4.0, 5.0, 6.0], shape=[3, 2], name='b')c = tf.matmul(a, b)# Creates a session with log_device_placement set to True.sess = tf.Session(config=tf.ConfigProto(log_device_placement=True))# Runs the op.print(sess.run(c))
測試結(jié)果如下圖
圖中
device:GPU:0
的意思就是說該運算用到了GPU。
如果想手動聲明讓電腦用CPU運算,請參考官方文檔
以下是一些安裝過程中常見的導(dǎo)致安裝失敗的問題:
- 在運行測試腳本的時候顯示一下報錯:
AttributeError: module 'tensorflow' has no attribute 'constant'
有可能是你把測試文件命名為了tenforflow.py,導(dǎo)致import 的時候import成了這個腳本,因此需要把tensorflow.py隨便改成別的名字,比如test.py。
2.當(dāng)你需要刪除tensorflow package的時候,如果安裝的時候是用pip安裝的,那么刪除的時候也要用pip。 同理,用conda安裝的要用conda指令來刪除。如下圖,tensorflow-gpu,顯示是用pip安裝的(請見前面第五步有講到安裝過程,官網(wǎng)推薦是用pip安裝。)
3.為啥我全部安裝正確也測試TENSORFLOW安裝成功(運行上述test.py成功),但是測試GPU的時候失敗,顯示一直是CPU在運行?
這可能是之前你用CONDA安裝過CPU版本的TENSORFLOW,或者ANACONDA自帶TENSORFLOW造成沖突。你需要刪除原有的TENSORFLOW重新安裝即可。用CONDA指令或者PIP指令刪除然后重新安裝就可以了。
4. 在安裝完ANACONDA后,使用jupyter notebook的時候,有可能會出現(xiàn)這樣的報錯
ImportError: DLL load failed: 找不到指定的模塊。
這個時候只要把如下的額外兩個環(huán)境變量添加以后,就可以正常在命令窗口通過輸入jupyter notebook來啟動了。