這些原因告訴你 機(jī)器學(xué)習(xí)為何選擇Python
來(lái)源:
奇酷教育 發(fā)表于:
2017-06-28 15:40:41
主要有以下原因: 1 Python是解釋語(yǔ)言,程序?qū)懫饋?lái)非常方便 寫(xiě)程序方便對(duì)做機(jī)器學(xué)習(xí)的人很重要?! ∫?yàn)榻?jīng)常需要對(duì)模型進(jìn)行各
主要有以下原因:
1. Python是解釋語(yǔ)言,程序?qū)懫饋?lái)非常方便
寫(xiě)程序方便對(duì)做機(jī)器學(xué)習(xí)的人很重要。
因?yàn)榻?jīng)常需要對(duì)模型進(jìn)行各種各樣的修改,這在編譯語(yǔ)言里很可能是牽一發(fā)而動(dòng)全身的事情,Python里通常可以用很少的時(shí)間實(shí)現(xiàn)。
舉例來(lái)說(shuō),在C等編譯語(yǔ)言里寫(xiě)一個(gè)矩陣乘法,需要自己分配操作數(shù)(矩陣)的內(nèi)存、分配結(jié)果的內(nèi)存、手動(dòng)對(duì)BLAS接口調(diào)用gemm、最后如果沒(méi)用smart pointer還得手動(dòng)回收內(nèi)存空間。python幾乎就是import numpy; numpy.dot兩句話的事。
當(dāng)然現(xiàn)在很多面向C/C++庫(kù)已經(jīng)支持托管的內(nèi)存管理了,這也讓開(kāi)發(fā)過(guò)程容易了很多,但解釋語(yǔ)言仍然有天生的優(yōu)勢(shì)--不需要編譯時(shí)間。這對(duì)機(jī)器學(xué)習(xí)這種需要大量prototyping和迭代的研究方向是非常有益工作效率的。
2. Python的開(kāi)發(fā)生態(tài)成熟,有很多有用的庫(kù)可以用
除了上面說(shuō)到的NumPy,還有SciPy、NLTK、os(自帶)等等不一而足。Python靈活的語(yǔ)法還使得包括文本操作、list/dict comprehension等非常實(shí)用的功能非常容易高效實(shí)現(xiàn)(編寫(xiě)和運(yùn)行效率都高),配合lambda等使用更是方便。這也是Python良性生態(tài)背后的一大原因。相比而言,Lua雖然也是解釋語(yǔ)言,甚至有LuaJIT這種神器加持,但其本身很難做到Python這樣,一是因?yàn)橛蠵ython這個(gè)前輩占領(lǐng)著市場(chǎng)份額,另一個(gè)也因?yàn)樗旧矸N種反常識(shí)的設(shè)計(jì)(比如全局變量)。不過(guò)借著Lua-Python bridge和Torch的東風(fēng),Lua似乎也在寄生興起。
3. Python的效率很高。
解釋語(yǔ)言的發(fā)展已經(jīng)大大超過(guò)許多人的想象。很多比如list comprehension的語(yǔ)法糖都是貼近內(nèi)核實(shí)現(xiàn)的。除了JIT[1]之外,還有Cython可以大幅增加運(yùn)行效率。最后,得益于Python對(duì)C的接口,很多像gnumpy, theano這樣高效、Python接口友好的庫(kù)可以加速程序的運(yùn)行,在強(qiáng)大團(tuán)隊(duì)的支撐下,這些庫(kù)的效率可能比一個(gè)不熟練的程序員用C寫(xiě)一個(gè)月調(diào)優(yōu)的效率還要高。
4.數(shù)據(jù)存儲(chǔ)方便
有sql,Hadoop,mangodb,Redis,Spark等
5.數(shù)據(jù)獲取方便
有Scrapy,beautifulsoup,requests,paramiko等
6.數(shù)據(jù)運(yùn)算方便
有pandas,Numpy,scipy等
7.輸出結(jié)果方便
有matplotlib,VisPy等
8.和其他語(yǔ)言交互方便
有ctypes,rpy2,Cython,SWIG,PyQt,boost.python
9.加速方便
有pypy,Cython,PyCUDA
10.圖形圖像方便
有PyOpenGL,PyOpenCV,mayavi2
11.信號(hào)處理方便
PyWavelets,scipy.signal
12.云系統(tǒng)支持方便
github,sourceforge,EC2,BAT,HPC
13.python開(kāi)源
python支持的平臺(tái)多,包括windows,Linux,unix,macos。而matlab太貴,只能調(diào)用其api,用python省錢,省錢就是賺錢。
python 和 c++ 做個(gè)比較。
c++ 的cpu效率是遠(yuǎn)遠(yuǎn)高于 python 的.不過(guò) python 是一門膠水語(yǔ)言,它可以和任何語(yǔ)言結(jié)合,基于這個(gè)優(yōu)點(diǎn),很多數(shù)據(jù)處理的python 庫(kù)底層都是 c++ 實(shí)現(xiàn)的,意思就是說(shuō):你用python寫(xiě)code,但效率是c++的。只有那些for 循環(huán),還是用python的效率高。
近年來(lái)機(jī)器學(xué)習(xí)最要是深度學(xué)習(xí),而深度學(xué)習(xí)使用cuda gpu加速遠(yuǎn)比cpu要快,而cuda 是c++寫(xiě)的。
所以現(xiàn)在TensorLayer、theano 等深度學(xué)習(xí)庫(kù)都是 python 編程、底層c++。
從上文的論述中,Python的重要性不言而喻,奇酷教育從零基礎(chǔ)打造
Python培訓(xùn) 高級(jí)開(kāi)發(fā)課程。奇酷教育Python課程將主要講授Python基礎(chǔ)知識(shí),穿插講解Python的最佳實(shí)踐,讓學(xué)員不僅僅學(xué)會(huì)編程的基本語(yǔ)法,還能學(xué)到資深工程師的編程經(jīng)驗(yàn),了解一線互聯(lián)網(wǎng)公司用到的Python工具和開(kāi)源項(xiàng)目,熟悉Python高手的編程風(fēng)格。
奇酷教育原創(chuàng)開(kāi)發(fā)的Python培訓(xùn)課程http://www.amandajane-cam.com/不僅涵蓋Web前后端開(kāi)發(fā)和網(wǎng)絡(luò)爬蟲(chóng)技術(shù),還包括獨(dú)有的數(shù)據(jù)分析和機(jī)器學(xué)習(xí),前端、服務(wù)端一網(wǎng)打盡??蓮氖耊eb前端、Web服務(wù)端、服務(wù)器運(yùn)維、網(wǎng)絡(luò)爬蟲(chóng)、大數(shù)據(jù)分析、機(jī)器學(xué)習(xí)等多種熱門職業(yè),學(xué)員百分百高薪就業(yè)!