querysetでbulk_create()とcreate()のパフォーマンス比較

今回はDjangoのquerysetでbulk_create()とcreate()のパフォーマンスを比較した結果について書きたいと思います。



querysetでbulk_create()とcreate()のパフォーマンス比較

当たり前ですが、create()よりもbulk_create()の方がパフォーマンスが良いです。
今回はどれくらいcreate()よりもbulk_create()の方がパフォーマンスが良いのか調査します。

パフォーマンス調査に当たって使用したmodelは次のBookモデルです。

パフォーマンスの調査に当たっては次のソースを準備しました。

titleやauthor、priceをすべて空で登録します。
それぞれcreate_test()はcreateを使って10000個のBookオブジェクトを作る関数、bulk_create_test()はbulk_createを使って10000個のBookオブジェクトを作る関数です。

create_test()とbulk_create_test()についてそれぞれ三回ずつ実行してみます。
初期条件として、Bookオブジェクトは一つもない状態でそれぞれ実行します。

createを使って10000個のBookオブジェクトを作る関数であるcreate_test()を三回実行した結果は次のとおりです。

一方、bulk_createを使って10000個のBookオブジェクトを作る関数であるbulk_create_test()を三回実行した結果は次のとおりです。

圧倒的と言えるほど、createよりもbulk_createの方がパフォーマンスが良いです。
その差はなんと60倍ほどでしょうか。

bulk_createが使えるのはDjangoのバージョンが1.4からですが、複数のオブジェクトを作成したい場合はcreateよりもbulk_createを使用した方が良いでしょう。

終わりに

今回はDjangoのquerysetでbulk_create()とcreate()のパフォーマンスを比較した結果について書きました。

最後までお読みいただきありがとうございます。
よろしければブログやTwitterでのシェアをお願いいたします。
コメントもお待ちしております。
誤植や勘違いなどございましたらコメント欄にて教えていただけると幸いです。






Django

Posted by ちこ