信息科學(xué)與工程學(xué)院博士生李小康的操作火了,130行代碼搞定核查數(shù)百人的核酸

點擊藍(lán)字 關(guān)注我們
了解與IT有關(guān)的人和事

來源:新華社
ID:xinhuashefabu1
程序IT圈
文末送書活動,記得看完啊 !
人工核查核酸報告費時費力,怎么辦?
4月7日,復(fù)旦大學(xué)官微發(fā)文,自3月初以來,學(xué)校啟動常態(tài)化核酸篩查工作,要求班級輔導(dǎo)員必須核查學(xué)生“健康云”核酸完成截圖,確?!安宦┮蝗恕薄?/p>
學(xué)校信息科學(xué)與工程學(xué)院博士生李小康的操作火了,幾分鐘就能快速核查數(shù)百人的核酸完成截圖,大大提高核查效率和精度!

01

從1小時到2分鐘,一串代碼搞定
據(jù)了解,李小康目前擔(dān)任學(xué)院2019級信息1班輔導(dǎo)員。
對于核查核酸報告的工作,他表示:“聽起來好像很簡單,但實際做的時候,一個班級的截圖可能就需要花上半小時核查,如果是人數(shù)多的院系可能需要更久,還可能會看錯看漏?!?/p>

李小康正在做志愿者
作為生物醫(yī)學(xué)工程專業(yè)博士生,他的研究方向是醫(yī)學(xué)影像與人工智能,平常會接觸很多圖像處理方法。李小康第一時間想到以前學(xué)到過的OCR (Optical Character Recognition,光學(xué)字符識別)技術(shù)。
“OCR可以把圖像中的文字識別出來,轉(zhuǎn)換為文本信息,就方便用來核查了。而且因為核酸截圖是打印字體,識別率非常高,幾乎可以做到100%準(zhǔn)確?!?/p>
他還想到了Python語言中的正則表達(dá)式——可以搜索到字符串中的特定模式內(nèi)容。
“使用正則表達(dá)式就可以把想要的信息從OCR識別的文本中篩選出來。最后,確認(rèn)好每張截圖里的姓名、檢測時間和是否已采樣等信息后,再把所有人的結(jié)果輸出到Excel文件中,方便人工確認(rèn)?!?/p>
最后,李小康確定了“OCR文字識別+正則表達(dá)式篩選”的程序思路。3月15日晚,他花了一個多小時就寫出了初始代碼,共130行,發(fā)現(xiàn)確實能夠跑通,且運行效率很高。

李小康最初寫程序時和學(xué)工同事的聊天
程序一寫好,李小康就在自己班級的核酸截圖數(shù)據(jù)上進行驗證,準(zhǔn)確率果然很高,甚至檢測出了之前人工核查沒有發(fā)現(xiàn)的問題。并且,程序運行時間很短,80多張圖只需要20多秒。
02

復(fù)旦大學(xué):有望全校覆蓋
目前,程序已在該學(xué)院服務(wù)兩周。李小康曾讓別的老師試用自己的程序進行核查。800幅截圖,原來要幾個人核對一個多小時,現(xiàn)在只需等2分鐘就拿到結(jié)果。

他把這件事發(fā)到朋友圈之后,不少同事表示很感興趣,他還把代碼分享了出去。為了方便不會編程的老師使用,李小康最后還把程序進行了封裝——用的時候,只要在命令行輸入一行代碼就可以運行。

程序輸出的Excel文件
據(jù)了解,學(xué)校信息辦也與李小康進行了對接。預(yù)計在不久的將來,師生們就可不用再手動收集核酸截圖,而是通過小程序直接上傳圖片,就可在后臺隨時查看統(tǒng)計結(jié)果。




4月7日下午,記者與李小康取得聯(lián)系時,他正在學(xué)校樓棟擔(dān)任志愿者送飯。
他說過:“原理也很簡單,只要是會寫代碼的人第一時間就會明白是怎么回事,但是不做相關(guān)工作的感受不到這件事情的費時費力,自然也不會想出辦法。我只是用我學(xué)到的知識解決實際工作中的困難?!?/p>
技術(shù)改變世界!
為“碼農(nóng)”李小康點贊!
來源:中國青年報(見習(xí)記者:陳垠杉),綜合復(fù)旦大學(xué)(作者:殷夢昊)。版權(quán)歸原作者所有,僅供分享使用。
?END?
贈書福利 贈送新書《從零開始學(xué)算法(基于Python)》共5本,剛剛上架!由「 電子工業(yè)博文視點出版社」贊助提供 ,感興趣的朋友推薦入手一本。

贈送新書《從零開始學(xué)算法(基于Python)》共5本,剛剛上架!由「 電子工業(yè)博文視點出版社」贊助提供 ,感興趣的朋友推薦入手一本。

本書的目的是幫助初學(xué)者掌握編程中的基礎(chǔ)算法,并通過Python語言進行實戰(zhàn)演練,通過即學(xué)即練的方式掌握這些經(jīng)典算法,讓讀者真正體會算法的美妙,成為讀者學(xué)習(xí)算法的領(lǐng)路人。 本書分為8章,涵蓋的主要內(nèi)容有:算法之美,通過生活中的例子學(xué)習(xí)算法;貪心算法、分而治之算法、樹算法、圖算法、動態(tài)規(guī)劃、回溯法、分支限界法。
同樣這次準(zhǔn)備了2種方式抽獎,「評論點贊、朋友圈點贊」這兩種方式都可以參與!感謝親愛的讀者們,你們的支持也是我持續(xù)更文最大的動力。
本次開獎時間為 2022.4.13 20:00
為了避免中獎后失聯(lián),提前加我微信號:itcodexy 。
本次開獎時間為 2022.4.13 20:00
為了避免中獎后失聯(lián),提前加我微信號:itcodexy 。
隨機抽獎(2本)
關(guān)注公眾號:前端技術(shù)編程 。回復(fù)關(guān)鍵詞:抽獎,參與!或者直接掃下面二維碼參與。

隨機抽獎(2本) 關(guān)注公眾號:前端技術(shù)編程 。回復(fù)關(guān)鍵詞:抽獎,參與!或者直接掃下面二維碼參與。
朋友圈點贊抽獎(3本)
記得先添加我微信,不然參加不了這個朋友圈活動 。
大獎:本文章我會轉(zhuǎn)發(fā)朋友圈,給第n位(具體數(shù)值看朋友圈發(fā)布時的規(guī)則)點贊朋友圈的同學(xué)送出一本 ,共3位。
記得先添加我微信,不然參加不了這個朋友圈活動 。 大獎:本文章我會轉(zhuǎn)發(fā)朋友圈,給第n位(具體數(shù)值看朋友圈發(fā)布時的規(guī)則)點贊朋友圈的同學(xué)送出一本 ,共3位。

點分享

點點贊

點在看
