2020年 算法工程師生存怪狀
訓(xùn)練數(shù)據(jù)是不是有問題?
這個(gè)場景是不是不太適合這個(gè)模型?
我早就覺得這個(gè)模型結(jié)構(gòu)很奇怪!
Tensorflow, 最流行的深度學(xué)習(xí)框架之一,起源于Google內(nèi)部,有非常完整的一套工具用于生產(chǎn)環(huán)境部署,可能是企業(yè)界最受歡迎的深度學(xué)習(xí)框架。
PyTorch, 最fancy的深度學(xué)習(xí)框架,fork自日本的Chainer, 使用起來較為方法,語法非常的Pythonic,相對于tensorflow的較為容易上手。
Keras, 深度學(xué)習(xí)高級接口,不限定后端。其接口設(shè)計(jì)非常優(yōu)雅,及其容易上手。
編程語言:
Python, 必備,?有一句流行語「Data scientist should use Python.」
Java/C++/Golang,可選,但是建議掌握。如果你需要部署模型到生產(chǎn)環(huán)境,考慮到各個(gè)公司的編程語言棧不同,但國內(nèi)大部分是Java/C++/Golang的其中一種或幾種,如果你會(huì)其中的一種編程語言,這會(huì)對你很有幫助。
SQL, 必備, 很常用,你不能不會(huì)。
常用庫:
Spark/Flink, 必備, 數(shù)據(jù)處理與流失計(jì)算。
ScikitLearn/Pandas/Numpy:可選,但強(qiáng)烈建議掌握。這是大家都會(huì)且經(jīng)常用到的工具,如果你還不會(huì),建議盡快掌握。且Numpy是很多Python數(shù)值計(jì)算的基礎(chǔ)庫,包括Tensorflow等等。
