<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          MySQL 大批量插入,如何過濾掉重復數(shù)據(jù)?

          共 2414字,需瀏覽 5分鐘

           ·

          2021-08-13 23:23

          點擊上方“程序員大白”,選擇“星標”公眾號

          重磅干貨,第一時間送達

          文章轉(zhuǎn)載:程序員老鬼

          線上庫有6個表存在重復數(shù)據(jù),其中2個表比較大,一個96萬+、一個30萬+,因為之前處理過相同的問題,就直接拿來了上次的Python去重腳本,腳本很簡單,就是連接數(shù)據(jù)庫,查出來重復數(shù)據(jù),循環(huán)刪除。


          emmmm,但是這個效率嘛,實在是太低了,1秒一條,重復數(shù)據(jù)大約2萬+,預估時間大約在8個小時左右。。。

          盲目依靠前人的東西,而不去自己思考是有問題的!總?cè)ハ胫霸趺纯梢裕F(xiàn)在怎么不行了,這也是有問題的!我發(fā)現(xiàn),最近確實狀態(tài)不太對,失去了探索和求知的欲望,今天算是一個警醒,頗有迷途知返的感覺。

          言歸正傳,下面詳細介紹去重步驟

          CREATE TABLE `animal` (  `id` int(11) NOT NULL AUTO_INCREMENT,  `name` varchar(20) DEFAULT NULL,  `age` int(11) DEFAULT NULL,  PRIMARY KEY (`id`)) ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8 COLLATE=utf8_bin;

          INSERT INTO `pilipa_dds`.`student` (`id`, `name`, `age`) VALUES ('1', 'cat', '12');INSERT INTO `pilipa_dds`.`student` (`id`, `name`, `age`) VALUES ('2', 'dog', '13');INSERT INTO `pilipa_dds`.`student` (`id`, `name`, `age`) VALUES ('3', 'camel', '25');INSERT INTO `pilipa_dds`.`student` (`id`, `name`, `age`) VALUES ('4', 'cat', '32');INSERT INTO `pilipa_dds`.`student` (`id`, `name`, `age`) VALUES ('5', 'dog', '42');

          目標:我們要去掉name相同的數(shù)據(jù)


          先看看哪些數(shù)據(jù)重復了

          SELECT name,count( 1 ) FROM student GROUP BYNAME HAVING count( 1 ) > 1;

          輸出:

          name count(1) cat 2 dog 2

          name為cat和dog的數(shù)據(jù)重復了,每個重復的數(shù)據(jù)有兩條;


          Select * From 表 Where 重復字段 In (Select 重復字段 From 表 Group By 重復字段 Having Count(1)>1)


          刪除全部重復數(shù)據(jù),一條不留


          直接刪除會報錯

          DELETE FROM student WHERE NAME IN ( SELECT NAME  FROM  student  GROUP BY NAME HAVING count( 1 ) > 1)

          報錯:

          1093 - You can't specify target table 'student' for update in FROM clause, Time: 0.016000s

          原因是:更新這個表的同時又查詢了這個表,查詢這個表的同時又去更新了這個表,可以理解為死鎖。mysql不支持這種更新查詢同一張表的操作


          解決辦法:把要更新的幾列數(shù)據(jù)查詢出來做為一個第三方表,然后篩選更新。

          DELETE FROM student WHERE NAME IN ( SELECT  t.NAME FROM ( SELECT NAME FROM student GROUP BY NAME HAVING count1 ) > 1 ) t)

          刪除表中刪除重復數(shù)據(jù),僅保留一條


          在刪除之前,我們可以先查一下,我們要刪除的重復數(shù)據(jù)是啥樣的

          SELECT * FROM student WHERE id NOT IN ( SELECT  t.id  FROM ( SELECT MIN( id ) AS id FROM student GROUP BY `name` ) t  )
          啥意思呢,就是先通過name分組,查出id最小的數(shù)據(jù),這些數(shù)據(jù)就是我們要留下的火種,那么再查詢出id不在這里面的,就是我們要刪除的重復數(shù)據(jù)。


          開始刪除重復數(shù)據(jù),僅留一條


          很簡單,剛才的select換成delete即可

          DELETE FROM student WHERE id NOT IN ( SELECT  t.id  FROM ( SELECT MIN( id ) AS id FROM student GROUP BY `name` ) t  )
          90萬+的表執(zhí)行起來超級快。



          “拍一拍” 能撤回了 !!!

          5款Chrome插件,第1款絕對良心!

          為開發(fā)色情游戲,這家公司赴日尋找AV女優(yōu)拍攝,期望暴力賺錢結(jié)果...

          拼多多終于釀成慘劇

          華為阿里下班時間曝光:所有的光鮮,都有加班的味道




          西質(zhì)結(jié)[]


          瀏覽 31
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  水多多成人精品视频 | 波多野结衣操逼视频 | 青青草美女视频 | 中文人妻无码一区二区三区不卡 | 8x8x皇冠视频免费观看 |