SQL 查詢總是先執(zhí)行SELECT語(yǔ)句嗎?
點(diǎn)擊關(guān)注上方“SQL數(shù)據(jù)庫(kù)開發(fā)”,
設(shè)為“置頂或星標(biāo)”,第一時(shí)間送達(dá)干貨
SQL 查詢的執(zhí)行順序

這張圖回答了以下這些問(wèn)題
可以在 GRROUP BY 之后使用 WHERE 嗎?(不行,WHERE 是在 GROUP BY 之后!) 可以對(duì)窗口函數(shù)返回的結(jié)果進(jìn)行過(guò)濾嗎?(不行,窗口函數(shù)是 SELECT 語(yǔ)句里,而 SELECT 是在 WHERE 和 GROUP BY 之后) 可以基于 GROUP BY 里的東西進(jìn)行 ORDER BY 嗎?(可以,ORDER BY 基本上是在最后執(zhí)行的,所以可以基于任何東西進(jìn)行 ORDER BY) LIMIT 是在什么時(shí)候執(zhí)行?(在最后!)
如果你想要知道一個(gè)查詢語(yǔ)句是否合法,或者想要知道一個(gè)查詢語(yǔ)句會(huì)返回什么,可以參考這張圖; 在涉及查詢性能或者與索引有關(guān)的東西時(shí),這張圖就不適用了。
混合因素:列別名
SELECT?CONCAT(first_name,?'?',?last_name)?AS?full_name,?count(*)
FROM?table
GROUP?BY?full_name
從這個(gè)語(yǔ)句來(lái)看,好像 GROUP BY 是在 SELECT 之后執(zhí)行的,因?yàn)樗昧?SELECT 中的一個(gè)別名。但實(shí)際上不一定要這樣,數(shù)據(jù)庫(kù)引擎可以把查詢重寫成這樣:
SELECT?CONCAT(first_name,?'?',?last_name)?AS?full_name,?count(*)
FROM?table
GROUP?BY?CONCAT(first_name,?'?',?last_name)
這樣 GROUP BY 仍然先執(zhí)行。
數(shù)據(jù)庫(kù)引擎還會(huì)做一系列檢查,確保 SELECT 和 GROUP BY 中的東西是有效的,所以會(huì)在生成執(zhí)行計(jì)劃之前對(duì)查詢做一次整體檢查。
數(shù)據(jù)庫(kù)可能不按照這個(gè)順序執(zhí)行查詢(優(yōu)化)
在實(shí)際當(dāng)中,數(shù)據(jù)庫(kù)不一定會(huì)按照 JOIN、WHERE、GROUP BY 的順序來(lái)執(zhí)行查詢,因?yàn)樗鼈儠?huì)進(jìn)行一系列優(yōu)化,把執(zhí)行順序打亂,從而讓查詢執(zhí)行得更快,只要不改變查詢結(jié)果。
這個(gè)查詢說(shuō)明了為什么需要以不同的順序執(zhí)行查詢:
SELECT?*?FROM
owners?LEFT?JOIN?cats?ON?owners.id?=?cats.owner
WHERE?cats.name?=?'mr?darcy'
如果只需要找出名字叫“mr darcy”的貓,那就沒(méi)必要對(duì)兩張表的所有數(shù)據(jù)執(zhí)行左連接,在連接之前先進(jìn)行過(guò)濾,這樣查詢會(huì)快得多,而且對(duì)于這個(gè)查詢來(lái)說(shuō),先執(zhí)行過(guò)濾并不會(huì)改變查詢結(jié)果。
數(shù)據(jù)庫(kù)引擎還會(huì)做出其他很多優(yōu)化,按照不同的順序執(zhí)行查詢,不過(guò)我并不是這方面的專家,所以這里就不多說(shuō)了。
LINQ 的查詢以 FROM 開頭
LINQ(C#和 VB.NET 中的查詢語(yǔ)法)是按照 FROM…WHERE…SELECT 的順序來(lái)的。這里有一個(gè) LINQ 查詢例子:
var?teenAgerStudent?=?from?s?in?studentList
??????????????????????where?s.Age?>?12?&&?s.Age?20
??????????????????????select?s;
pandas 中的查詢也基本上是這樣的,不過(guò)你不一定要按照這個(gè)順序。我通常會(huì)像下面這樣寫 pandas 代碼:
df?=?thing1.join(thing2)??????#?JOIN
df?=?df[df.created_at?>?1000]?#?WHERE
df?=?df.groupby('something',?num_yes?=?('yes',?'sum'))?#?GROUP?BY
df?=?df[df.num_yes?>?2]???????#?HAVING,?對(duì)?GROUP?BY?結(jié)果進(jìn)行過(guò)濾
df?=?df[['num_yes',?'something1',?'something']]?#?SELECT,?選擇要顯示的列
df.sort_values('sometthing',?ascending=True)[:30]?#?ORDER?BY?和?LIMIT
df[:30]
作者丨Julia Evans? ?譯者丨無(wú)明? ?
infoq.cn/article/Oke8hgilga3PTZ3gWvbg
我是岳哥,最后給大家分享我寫的SQL兩件套:《SQL基礎(chǔ)知識(shí)第二版》和《SQL高級(jí)知識(shí)第二版》的PDF電子版。里面有各個(gè)語(yǔ)法的解釋、大量的實(shí)例講解和批注等等,非常通俗易懂,方便大家跟著一起來(lái)實(shí)操。
有需要的讀者可以下載學(xué)習(xí),在下面的公眾號(hào)「數(shù)據(jù)前線」(非本號(hào))后臺(tái)回復(fù)關(guān)鍵字:SQL,就行
數(shù)據(jù)前線 ——End——
后臺(tái)回復(fù)關(guān)鍵字:1024,獲取一份精心整理的技術(shù)干貨
后臺(tái)回復(fù)關(guān)鍵字:進(jìn)群,帶你進(jìn)入高手如云的交流群。
推薦閱讀

