MySQL 批量插入:如何不插入重復(fù)數(shù)據(jù)?
業(yè)務(wù)很簡(jiǎn)單:需要批量插入一些數(shù)據(jù),數(shù)據(jù)來(lái)源可能是其他數(shù)據(jù)庫(kù)的表,也可能是一個(gè)外部excel的導(dǎo)入
那么問(wèn)題來(lái)了,是不是每次插入之前都要查一遍,看看重不重復(fù),在代碼里篩選一下數(shù)據(jù),重復(fù)的就過(guò)濾掉呢?
向大數(shù)據(jù)數(shù)據(jù)庫(kù)中插入值時(shí),還要判斷插入是否重復(fù),然后插入。如何提高效率
看來(lái)這個(gè)問(wèn)題不止我一個(gè)人苦惱過(guò)。
解決的辦法有很多種,不同的場(chǎng)景解決方案也不一樣,數(shù)據(jù)量很小的情況下,怎么搞都行,但是數(shù)據(jù)量很大的時(shí)候,這就不是一個(gè)簡(jiǎn)單的問(wèn)題了。
幾百萬(wàn)的數(shù)據(jù),不可能查出來(lái),做去重處理
說(shuō)一下我Google到的解決方案??
1、insert ignore into
當(dāng)插入數(shù)據(jù)時(shí),如出現(xiàn)錯(cuò)誤時(shí),如重復(fù)數(shù)據(jù),將不返回錯(cuò)誤,只以警告形式返回。所以使用ignore請(qǐng)確保語(yǔ)句本身沒(méi)有問(wèn)題,否則也會(huì)被忽略掉。例如:
INSERT?IGNORE?INTO?user?(name)?VALUES?('telami')
這種方法很簡(jiǎn)便,但是有一種可能,就是插入不是因?yàn)橹貜?fù)數(shù)據(jù)報(bào)錯(cuò),而是因?yàn)槠渌驁?bào)錯(cuò)的,也同樣被忽略了~
2、on duplicate key update
當(dāng)primary或者unique重復(fù)時(shí),則執(zhí)行update語(yǔ)句,如update后為無(wú)用語(yǔ)句,如id=id,則同1功能相同,但錯(cuò)誤不會(huì)被忽略掉。
例如,為了實(shí)現(xiàn)name重復(fù)的數(shù)據(jù)插入不報(bào)錯(cuò),可使用一下語(yǔ)句:
INSERT?INTO?user?(name)?VALUES?('telami')?ON?duplicate?KEY?UPDATE?id?=?id
這種方法有個(gè)前提條件,就是,需要插入的約束,需要是主鍵或者唯一約束(在你的業(yè)務(wù)中那個(gè)要作為唯一的判斷就將那個(gè)字段設(shè)置為唯一約束也就是unique key)。
3、insert … select … where not exist
根據(jù)select的條件判斷是否插入,可以不光通過(guò)primary 和unique來(lái)判斷,也可通過(guò)其它條件。例如:
INSERT?INTO?user?(name)?SELECT?'telami'?FROM?dual?WHERE?NOT?EXISTS?(SELECT?id?FROM?user?WHERE?id?=?1)
這種方法其實(shí)就是使用了mysql的一個(gè)臨時(shí)表的方式,但是里面使用到了子查詢,效率也會(huì)有一點(diǎn)點(diǎn)影響,如果能使用上面的就不使用這個(gè)。
如果您正在學(xué)習(xí)Spring Boot,推薦一個(gè)連載多年還在繼續(xù)更新的免費(fèi)教程:http://blog.didispace.com/spring-boot-learning-2x/
4、replace into
如果存在primary or unique相同的記錄,則先刪除掉。再插入新記錄。
REPLACE?INTO?user?SELECT?1,?'telami'?FROM?books
這種方法就是不管原來(lái)有沒(méi)有相同的記錄,都會(huì)先刪除掉然后再插入。
實(shí)踐
選擇的是第二種方式
"batchSaveUser"?parameterType="list">
????????insert?into?user?(id,username,mobile_number)
????????values
????????"list"?item="item"?index="index"?separator=",">
????????????(
#{item.id},
#{item.username},
#{item.mobileNumber}
)
ON?duplicate?KEY?UPDATE?id?=?id?
這里用的是Mybatis,批量插入的一個(gè)操作,mobile_number 已經(jīng)加了唯一約束。這樣在批量插入時(shí),如果存在手機(jī)號(hào)相同的話,是不會(huì)再插入了的。
來(lái)源:www.telami.cn
