mysqlupdate性能差_msyql性能优化之update
我们都知道在MySQL中批量insert的速度会⽐⼀条条insert快很多,在MySQL中批量更新我们可能使⽤update,replace into来操作,下⾯⼩编来给各位同学详细介绍MySQL 批量更新与性能吧。
批量更新
MySQL更新语句很简单,更新⼀条数据的某个字段,⼀般这样写:
UPDATE table SET field = 'value' WHERE other_field = 'other_value';
如果更新同⼀字段为同⼀个值,MySQL也很简单,修改下WHERE即可:
UPDATE table SET field='value' WHERE other_field in (val_1, val_2, ...);
那如果更新多条数据为不同的值,可能很多⼈会这样写:
foreach ($display_order as $id => $ordinal) {
$sql = "UPDATE categories SET display_order = $ordinal WHERE id = $id";
mysql_query($sql);
}
即是循环⼀条⼀条的更新记录,⼀条记录update⼀次,这样性能很差,也很容易造成阻塞。
那么能不能⼀条sql语句实现批量更新呢?MySQL并没有提供直接的⽅法来实现批量更新,但是可以⽤点⼩技巧来实现。
UPDATE table
SET field = CASE id
WHEN 1 THEN 'value'
WHEN 2 THEN 'value'
WHEN 3 THEN 'value'
END
WHERE id IN (1,2,3)
这⾥使⽤了 CASE WHEN 这个⼩技巧来实现批量更新。
举个例⼦:
UPDATE categories
SET display_order = CASE id
WHEN 1 THEN 3
WHEN 2 THEN 4
WHEN 3 THEN 5
END
WHERE id IN (1,2,3)
这句SQL的意思是,更新display_order 字段,如果id=1 则display_order 的值为3,如果id=2 则 display_order 的值为4,如果id=3
则 display_order 的值为5。
即是将条件语句写在了⼀起。
这⾥的WHERE部分不影响代码的执⾏,但是会提⾼sql执⾏的效率。
确保sql语句仅执⾏需要修改的⾏数,这⾥只有3条数据进⾏更新,⽽WHERE⼦句确保只有3⾏数据执⾏。如果更新多个值的话,只需要稍加修改:
UPDATE categories
SET display_order = CASE id
WHEN 1 THEN 3
WHEN 2 THEN 4
WHEN 3 THEN 5
END,
title = CASE id
WHEN 1 THEN 'New Title 1'
WHEN 2 THEN 'New Title 2'
WHEN 3 THEN 'New Title 3'
END
WHERE id IN (1,2,3)
到这⾥,已经完成⼀条MySQL语句更新多条记录了。
但是要在业务中运⽤,需要结合服务端语⾔,这⾥以php为例,构造这条MySQL语句:
$display_order = array(
1 => 4,
2 => 1,
3 => 2,
4 => 3,
5 => 9,
6 => 5,
7 => 8,
8 => 9
);
$ids = implode(',', array_keys($display_order));
$sql = "UPDATE categories SET display_order = CASE id ";
foreach ($display_order as $id => $ordinal) {
$sql .= sprintf("WHEN %d THEN %d ", $id, $ordinal);
}
$sql .= "END WHERE id IN ($ids)";
echo $sql;
这个例⼦,有8条记录进⾏更新,代码也很容易理解。
性能分析
当我使⽤上万条记录利⽤MySQL批量更新,发现使⽤最原始的批量update发现性能很差。
将⽹上看到的总结⼀下⼀共有以下三种办法:
1、批量update,⼀条记录update⼀次,性能很差
update test_tbl set dr='2' WHERE id=1;
2、replace into 或者insert into ...on duplicate key update
replace into test_tbl (id,dr) values (1,'2'),(2,'3'),...(x,'y');
或者使⽤
insert into test_tbl (id,dr) values (1,'2'),(2,'3'),...(x,'y') on duplicate key update dr=values(dr);
3、创建临时表,先更新临时表,然后从临时表中update
CREATE TEMPORARY TABLE tmp (
id int(4) primary key,
dr varchar(50)
);
INSERT INTO tmp VALUES (0,'gone'), (1,'xx'),...(m,'yy');
UPDATE test_tbl, tmp SET test_tbl.dr=tmp.dr WHERE test_tbl.id=tmp.id;
注意:这种⽅法需要⽤户有temporary 表的create 权限。
下⾯是上述⽅法update 100000条数据的性能测试结果:
1、逐条UPDATE
real 0m15.557s
user 0m1.684s
sys 0m1.372s
2、REPLACE INTO
real 0m1.394s
user 0m0.060s
sys 0m0.012s
3、INSERT INTO ON DUPLICATE KEY UPDATE
real 0m1.474s
user 0m0.052s
sys 0m0.008s
4、CREATE TEMPLORARY TABLE 并 UPDATE
real 0m0.643s
user 0m0.064s
sys 0m0.004s
就测试结果来看,测试当时使⽤replace into性能较好。
注意:
REPLACE INTO 和 INSERT INTO ON DUPLICATE KEY UPDATE 的不同在于:
REPLACE INTO操作本质是对重复的记录先DELETE 后INSERT,如果更新的字段不全会将缺失的字段置为缺省值。
INSERT INTO则只是UPDATE重复记录,不会改变其它字段。
//实测临时表更新mysql的性能数据如下。
⼀条条更新执⾏结果,22079条记录
批量sql更新执⾏结果,性能有所提升但是并不⾼
临时表更新,提升的幅度很多
附上执⾏逻辑的代码
$strartTime=microtime(true);
$optArr=array(PDO::MYSQL_ATTR_INIT_COMMAND => 'SET NAMES UTF8');
$dsn='mysql:host=172.12.10.155; port=3306; dbname=kana_task';
$pdoObj=new PDO($dsn, 'username', 'password', $optArr);
$sql = "SELECT * FROM `kana_task`.`cdkey_list` ";
echo $sql;
$ret = $pdoObj->query($sql);
if($ret instanceof PDOStatement)
{
while($row=$ret->fetch(PDO::FETCH_ASSOC)){
echo $row['id'].PHP_EOL;
$allInfo[$row['id']]=$row;
}
}
replace into$pdoObj->exec('create table cdkey_list_tmp like cdkey_list;');
$baseStr='INSERT INTO `kana_task`.`cdkey_list_tmp` (id,overtime,`name`,`pid`,`content`,`aid`,`tid`,`type`) VALUES ' ; $i=$tnum=0;
$sql='';
echo '查询耗时:'.(microtime(true)-$strartTime).PHP_EOL;
//循环更新时间
foreach ($allInfo as $id=>$tmpVal){
$tmpVal['overtime']=$tmpVal['overtime']+1;
$lineStr="({$tmpVal['id']},{$tmpVal['overtime']},'{$tmpVal['name']}',{$tmpVal['pid']},'{$tmpVal['content']}',{$tmpVal['aid']}, {$tmpVal['tid']},{$tmpVal['type']}),";
$sql=$sql.$lineStr;
$i++;
$tnum++;
if($i>=500){//每次插⼊500条
$sql=substr($sql,0,-1);
$sql=$baseStr.$sql.";";
$pdoObj->exec($sql);
echo $tnum.PHP_EOL;
$i=0;
$sql='';
}
//if($tnum>15) break;
}
echo '插⼊完成耗时:'.(microtime(true)-$strartTime).PHP_EOL;
$pdoObj->exec('UPDATE `kana_task`.`cdkey_list`,`kana_task`.`cdkey_list_tmp` SET
cdkey_list.overtime=cdkey_list_tmp.overtime WHERE cdkey_list.id=cdkey_list_tmp.id;');
echo '更新完成耗时:'.(microtime(true)-$strartTime).PHP_EOL;
//清空临时表
$pdoObj->exec('truncate table `kana_task`.`cdkey_list_tmp`;');
echo '总耗时:'.(microtime(true)-$strartTime).PHP_EOL;
var_dump(count($allInfo));exit;
exit;
使⽤Replace into ⽅式更新的测试结果
此⽅法和临时表的性能差不多,但是操作更加简单,SQL逻辑也简单,
但是存在字段变更或者其它操作导致的其它⾮必要更新字段值被误写的风险
如果是千万级别的数据表。建议是分批次更新。后续更好的优化⽅式欢迎⼤家拍砖。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论