<kbd id="afajh"><form id="afajh"></form></kbd>
<strong id="afajh"><dl id="afajh"></dl></strong>
    <del id="afajh"><form id="afajh"></form></del>
        1. <th id="afajh"><progress id="afajh"></progress></th>
          <b id="afajh"><abbr id="afajh"></abbr></b>
          <th id="afajh"><progress id="afajh"></progress></th>

          MySQL 大批量插入,如何過濾掉重復數(shù)據(jù)?

          共 3808字,需瀏覽 8分鐘

           ·

          2021-08-11 11:46

          往期熱門文章:
          1、Spring官方為什么建議構造器注入?
          2、還在用 Random生成隨機數(shù)?試試 ThreadLocalRandom,超好用!
          3、這些年 Java8 的 Optional 你用對了嗎?
          4、當 Docker 遇上 IDEA ,生產(chǎn)力徹底炸裂了
          5、如何把Spring Boot的Jar包做成exe?超詳細教程來了!
          來源:telami.cn/2019/mysql-removes-duplicate -data-and-keeping-only-one/
          加班原因是上線,解決線上數(shù)據(jù)庫存在重復數(shù)據(jù)的問題,發(fā)現(xiàn)了程序的bug,很好解決,有點問題的是,修正線上的重復數(shù)據(jù)。
          線上庫有6個表存在重復數(shù)據(jù),其中2個表比較大,一個96萬+、一個30萬+,因為之前處理過相同的問題,就直接拿來了上次的Python去重腳本,腳本很簡單,就是連接數(shù)據(jù)庫,查出來重復數(shù)據(jù),循環(huán)刪除。
          emmmm,但是這個效率嘛,實在是太低了,1秒一條,重復數(shù)據(jù)大約2萬+,預估時間大約在8個小時左右。。。
          盲目依靠前人的東西,而不去自己思考是有問題的!總去想之前怎么可以,現(xiàn)在怎么不行了,這也是有問題的!我發(fā)現(xiàn),最近確實狀態(tài)不太對,失去了探索和求知的欲望,今天算是一個警醒,頗有迷途知返的感覺。
          言歸正傳,下面詳細介紹去重步驟。
          CREATE TABLE `animal` (
            `id` int(11NOT NULL AUTO_INCREMENT,
            `name` varchar(20DEFAULT NULL,
            `age` int(11DEFAULT NULL,
            PRIMARY KEY (`id`)
          ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8 COLLATE=utf8_bin;


          INSERT INTO `pilipa_dds`.`student` (`id``name``age`VALUES ('1''cat''12');
          INSERT INTO `pilipa_dds`.`student` (`id``name``age`VALUES ('2''dog''13');
          INSERT INTO `pilipa_dds`.`student` (`id``name``age`VALUES ('3''camel''25');
          INSERT INTO `pilipa_dds`.`student` (`id``name``age`VALUES ('4''cat''32');
          INSERT INTO `pilipa_dds`.`student` (`id``name``age`VALUES ('5''dog''42');
          目標:我們要去掉name相同的數(shù)據(jù)。
          先看看哪些數(shù)據(jù)重復了
          SELECT name,count1 ) 
          FROM
           student 
          GROUP BY
          NAME 
          HAVING
           count1 ) > 1;
          輸出:
          name count(1) cat 2 dog 2
          name為cat和dog的數(shù)據(jù)重復了,每個重復的數(shù)據(jù)有兩條;
          Select * From 表 Where 重復字段 In (Select 重復字段 From 表 Group By 重復字段 Having Count(1)>1)

          刪除全部重復數(shù)據(jù),一條不留

          直接刪除會報錯
          DELETE 
          FROM
           student 
          WHERE
           NAME IN (
           SELECT NAME 
           FROM
            student 
           GROUP BY
           NAME 
          HAVING
           count1 ) > 1)
          報錯:
          1093 - You can't specify target table 'student' for update in FROM clause, Time: 0.016000s
          原因是:更新這個表的同時又查詢了這個表,查詢這個表的同時又去更新了這個表,可以理解為死鎖。mysql不支持這種更新查詢同一張表的操作
          解決辦法:把要更新的幾列數(shù)據(jù)查詢出來做為一個第三方表,然后篩選更新。
          DELETE 
          FROM
           student 
          WHERE
           NAME IN (
           SELECT
            t.NAME 
          FROM
           ( SELECT NAME FROM student GROUP BY NAME HAVING count1 ) > 1 ) t)

          刪除表中刪除重復數(shù)據(jù),僅保留一條

          在刪除之前,我們可以先查一下,我們要刪除的重復數(shù)據(jù)是啥樣的
          SELECT
           * 
          FROM
           student 
          WHERE
           id NOT IN (
           SELECT
            t.id 
           FROM
           ( SELECT MINid ) AS id FROM student GROUP BY `name` ) t 
           )
          啥意思呢,就是先通過name分組,查出id最小的數(shù)據(jù),這些數(shù)據(jù)就是我們要留下的火種,那么再查詢出id不在這里面的,就是我們要刪除的重復數(shù)據(jù)。

          開始刪除重復數(shù)據(jù),僅留一條

          很簡單,剛才的select換成delete即可
          DELETE 
          FROM
           student 
          WHERE
           id NOT IN (
           SELECT
            t.id 
           FROM
           ( SELECT MINid ) AS id FROM student GROUP BY `name` ) t 
           )
          90萬+的表執(zhí)行起來超級快。
          All done ????????~

          最近熱文閱讀:

          1、Spring官方為什么建議構造器注入?
          2、還在用 Random生成隨機數(shù)?試試 ThreadLocalRandom,超好用!
          3、這些年 Java8 的 Optional 你用對了嗎?
          4、當 Docker 遇上 IDEA ,生產(chǎn)力徹底炸裂了
          5、如何把Spring Boot的Jar包做成exe?超詳細教程來了!
          6、徹底搞懂 Nginx 的五大應用場景
          7、推薦60個相見恨晚的神器工具
          8、為什么有些大公司技術弱爆了?
          9、這 40 道 Redis 面試題讓你不再慌(附答案)
          10、優(yōu)秀的代碼都是如何分層的?
          關注公眾號,你想要的Java都在這里

          瀏覽 25
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          評論
          圖片
          表情
          推薦
          點贊
          評論
          收藏
          分享

          手機掃一掃分享

          分享
          舉報
          <kbd id="afajh"><form id="afajh"></form></kbd>
          <strong id="afajh"><dl id="afajh"></dl></strong>
            <del id="afajh"><form id="afajh"></form></del>
                1. <th id="afajh"><progress id="afajh"></progress></th>
                  <b id="afajh"><abbr id="afajh"></abbr></b>
                  <th id="afajh"><progress id="afajh"></progress></th>
                  一级片在线免费看 | 一集黄色毛片 | 欧美性爱中文字幕 | 中国无套毛片学生妹女 | 亚洲a色|