獨(dú)家 | 數(shù)據(jù)科學(xué)家對(duì)可復(fù)用Python代碼的實(shí)用管理方法(附鏈接)
作者:Matthew Mayo, KDnuggets
翻譯:殷之涵
校對(duì):歐陽錦
本文約3000字,建議閱讀5分鐘
本文為大家介紹了四種關(guān)于復(fù)用Python代碼的管理方法,以提高代碼的效率及可讀性等。
https://stackoverflow.com/questions/1883980/find-the-nth-occurrence-of-substring-in-a-string)。
def find_nth(haystack, needle, n):start = haystack.find(needle)while start >= 0 and n > 1:start = haystack.find(needle, start+len(needle))n -= 1return start
from textproc import find_nthsegment = line[:find_nth(line, ',', 4)].strip()
import pandas as pd# Read CSV file into dataframecsv_file = 'data.csv'df = pd.read_csv(csv_file)# Iterate over df, creating numbered list entriesi = 1for index, row in df.iterrows():entry = '<b>' + str(i) + \'. <a href="' + \row['url'] + \'">' + \row['title'] + \'</a> + \'\n\n<blockquote>\n' + \row['description'] + \'\n</blockquote>\n'i += 1print(entry)
AutoKey
https://github.com/autokey/autokey
import sys, requestsimport numpy as npimport pandas as pdimport textheroimport scattertext as stimport spacyfrom spacy.lang.en.stop_words import STOP_WORDSfrom datasets import load_metric, list_metricsfrom transformers import pipelinefrom fastapi import FastAPI
譯者簡(jiǎn)介
殷之涵(Jane),研究生畢業(yè)于康奈爾大學(xué)生物統(tǒng)計(jì)與數(shù)據(jù)科學(xué)專業(yè),本科畢業(yè)于普渡大學(xué)精算與應(yīng)用統(tǒng)計(jì)專業(yè)。目前在騰訊擔(dān)任數(shù)據(jù)科學(xué)家,主要負(fù)責(zé)騰訊視頻用戶增長(zhǎng)&市場(chǎng)營(yíng)銷數(shù)據(jù)科學(xué)方面的工作;此前在京東任數(shù)據(jù)分析師一年半,負(fù)責(zé)通過指標(biāo)體系搭建、統(tǒng)計(jì)分析、數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)建模來驅(qū)動(dòng)決策、制定并落地億級(jí)用戶的精細(xì)化運(yùn)營(yíng)策略。對(duì)數(shù)據(jù)科學(xué)充滿興趣和熱情,希望通過多年勤懇深耕成長(zhǎng)為真正的領(lǐng)域?qū)<摇?/span>
翻譯組招募信息
工作內(nèi)容:需要一顆細(xì)致的心,將選取好的外文文章翻譯成流暢的中文。如果你是數(shù)據(jù)科學(xué)/統(tǒng)計(jì)學(xué)/計(jì)算機(jī)類的留學(xué)生,或在海外從事相關(guān)工作,或?qū)ψ约和庹Z水平有信心的朋友歡迎加入翻譯小組。
你能得到:定期的翻譯培訓(xùn)提高志愿者的翻譯水平,提高對(duì)于數(shù)據(jù)科學(xué)前沿的認(rèn)知,海外的朋友可以和國(guó)內(nèi)技術(shù)應(yīng)用發(fā)展保持聯(lián)系,THU數(shù)據(jù)派產(chǎn)學(xué)研的背景為志愿者帶來好的發(fā)展機(jī)遇。
其他福利:來自于名企的數(shù)據(jù)科學(xué)工作者,北大清華以及海外等名校學(xué)生他們都將成為你在翻譯小組的伙伴。
點(diǎn)擊文末“閱讀原文”加入數(shù)據(jù)派團(tuán)隊(duì)~
轉(zhuǎn)載須知
如需轉(zhuǎn)載,請(qǐng)?jiān)陂_篇顯著位置注明作者和出處(轉(zhuǎn)自:數(shù)據(jù)派ID:DatapiTHU),并在文章結(jié)尾放置數(shù)據(jù)派醒目二維碼。有原創(chuàng)標(biāo)識(shí)文章,請(qǐng)發(fā)送【文章名稱-待授權(quán)公眾號(hào)名稱及ID】至聯(lián)系郵箱,申請(qǐng)白名單授權(quán)并按要求編輯。
發(fā)布后請(qǐng)將鏈接反饋至聯(lián)系郵箱(見下方)。未經(jīng)許可的轉(zhuǎn)載以及改編者,我們將依法追究其法律責(zé)任。
點(diǎn)擊“閱讀原文”擁抱組織


