|
【知乎用戶的回答(38票)】: 首先,不同的位置在不同公司里的意思和工作內(nèi)容有可能迥異,所以這里只說一下行業(yè)共識的部分,不代表你看到什么 title 就能一定得到我所說的這種內(nèi)容。 Data Analyst: non-technical position,基本要求是別人(data engineer)把 data 整理好了給你,你的主要工作是根據(jù) business users 的要求做 reports,寫總結(jié),等等。 Database Engineer: technical position,分工不同工作內(nèi)容不同,分有 database architect(曾經(jīng) @Rio 說不知道有這個 title,不過我好多朋友就是做這個的,理論上是 database engineer 的最高級別,類似 principle engineer 是 software engineer 里的最高級別那種),databasedeveloper, database administrator。具體工作分工也沒那么明確,不過具體到個人一般會有喜好,就像 software engineer 會有自己喜歡的編程語言之類的分工。 Data Scientist: misnomer(在有的公司是 non-techinical 在有的公司是 technical,你看看還能更混亂不)。一般我直接理解成一些人給自己工作亂加花邊的行為(驕傲地身為其中一員)。有很多公司的 data scientist 做成了類似 analyst,有的公司跟 software engineer 差不多,反正很多時候,因為 data analysis 這個行當本質(zhì)上還只是剛剛開始,大眾的誤解多過理解,大眾的期待多過現(xiàn)實,反正你經(jīng)??匆姷氖?,只要工作里跟 data 沾了邊又有那么點四不像性質(zhì)(話說 start-up 里完全不四不像的位置還真不多),基本上都會有些奇奇怪怪的人頂著 data scientist 的帽子跑來跑去。 我個人心目中的 data scientist,對數(shù)據(jù)這件事有自己的理解,把獲取、掌握和解碼數(shù)據(jù)做成商業(yè)運作里非常重要的一個環(huán)節(jié)。工作內(nèi)容呢,就是一條作業(yè)鏈,右端接口是跟 execs 交流數(shù)據(jù)里得來的商業(yè)智能(BI 也是個 misnomer,不過我覺得它本質(zhì)上其實是 make sense 的,就是經(jīng)常被人跟 analyst 混為一談),左端接口是 big data architecture——不管 open source 還是 closed——簡言之,就是從獲取數(shù)據(jù)到對數(shù)據(jù)的最終消費全部包括。所以 data science 不是一個 job title,而是一個 team。 【盧樹言的回答(2票)】: 現(xiàn)在忙到爆真的沒時間細講... 開頭就有一節(jié)專門講這三個職業(yè)的區(qū)別,分別需要的不同的技能。 真的有興趣可以找來看。不管評價好不好,看到新知識總是重要的。 【HuangRyan的回答(1票)】: Data Scientist、Data Analyst、Data Engineer 的工作對象都是Data(這真是句廢話,哇咔) Data Enginner 所做的一切都為了Data Management,具體內(nèi)容包括數(shù)據(jù)模型、數(shù)據(jù)架構(gòu)、數(shù)據(jù)標準、元數(shù)據(jù)、主數(shù)據(jù)、數(shù)據(jù)治理、數(shù)據(jù)管控等等,Data Enginner的目標是把數(shù)據(jù)整好,存儲成本低,查詢效率高,至于怎么使用這些數(shù)據(jù)不是他們關(guān)心的范疇。 Data Analyst所做的一切都是為了回答問題。這些問題可能來自業(yè)務(wù)部門,也可能來自各級管理人員,有些問題就是想知道某些具體數(shù)字,也有些問題是開放式的探索問題,例如為什么這個月銷量下降等等。Data Analyst在Data Enginner提供的數(shù)據(jù)基礎(chǔ)之上進行探索分析,如統(tǒng)計分析或機器學習等,目的是找到問題的正確答案。 Data Scientist是一個自Hi型的忽悠理念。什么是Scientist?按維基百科的定義,Scientist廣義上指使用系統(tǒng)化的活動來發(fā)現(xiàn)新知識的人,狹義的定義指使用科學方法做研究的人?,F(xiàn)在業(yè)界所謂的Data Scientist是數(shù)據(jù)應用領(lǐng)域的混合體,他無所不能,他要擁有相關(guān)領(lǐng)域的各種技能,哪有需要就往那里搬,能獨立承擔從數(shù)據(jù)處理、分析探索到實踐應用直至最終產(chǎn)生業(yè)務(wù)價值全流程服務(wù)的全能超人,聽起來很高大上,不過和科學不太搭邊,叫科學家有點勉強了。 【知乎用戶的回答(0票)】: 實際上混著用的,沒有什么明確的分野。不過如果你是analyst,那么你基本就和engineering不沾邊了 【ExtendedRange的回答(0票)】: Data Scientists vs. Data Engineers 原文地址:知乎 |
|
|