转自http://www.csharpwin.com/csharpspace/12089r677.shtml
摘要:做大批量数据插入的时候,如果用Insert into ... values (...)这种方式的话效率极低,这里介绍两种性能比较好的批量插入方法。
在做大批量数据插入的时候,如果用Insert into ... values (...)这种方式的话效率极低,这里介绍两种性能比较好的批量插入方法。
1. 使用SqlBulkCopy
{
Stopwatch stopwatch =new Stopwatch();
stopwatch.Start();
DataTable dataTable = GetTableSchema();
string passportKey;
for (int i =0; i < count; i++)
{
passportKey = Guid.NewGuid().ToString();
DataRow dataRow = dataTable.NewRow();
dataRow[0] = passportKey;
dataTable.Rows.Add(dataRow);
}
SqlBulkCopy sqlBulkCopy =new SqlBulkCopy(connectionString);
sqlBulkCopy.DestinationTableName ="Passport";
sqlBulkCopy.BatchSize = dataTable.Rows.Count;
SqlConnection sqlConnection =new SqlConnection(connectionString);
sqlConnection.Open();
if (dataTable!=null&& dataTable.Rows.Count!=0)
{
sqlBulkCopy.WriteToServer(dataTable);
}
sqlBulkCopy.Close();
sqlConnection.Close();
stopwatch.Stop();
return stopwatch.ElapsedMilliseconds;
}
使用SqlBulkCopy类进行数据插入其原理是采用了SQL Server的BCP协议进行数据的批量复制。这里我们先要建好一个DataTable(最好是通过DataAdapter来灌数据得到,因为这样出来的DataTable就已经有跟数据表相同的列定义,可以免去之后Mapping Column的步骤),把要插入的数据加进这个DataTable中,然后用SqlBulkCopy的实例来插入到数据库中。经过测试,SqlBulkCopy方法比直接用Sql语句插入数据的效率高出将近25倍。
2. 使用数据库中的Table类型变量实现数据插入
这种方法的前提是数据库中必须支持Table类型的变量。
CreatePROCEDURE[dbo].[CreatePassportWithTVP]
@TVP PassportTableType readonly
AS
BEGIN
SET NOCOUNT ON;
Insertinto Passport(PassportKey) select PassportKey from@TVP
END
{
Stopwatch stopwatch =new Stopwatch();
stopwatch.Start();
DataTable dataTable = GetTableSchema();
string passportKey;
for (int i =0; i < count; i++)
{
passportKey = Guid.NewGuid().ToString();
DataRow dataRow = dataTable.NewRow();
dataRow[0] = passportKey;
dataTable.Rows.Add(dataRow);
}
SqlParameter[] sqlParameter =
{ new SqlParameter("@TVP", dataTable) };
SqlHelper.ExecuteNonQuery(connectionString,
CommandType.StoredProcedure, "CreatePassportWithTVP",
sqlParameter);
stopwatch.Stop();
return stopwatch.ElapsedMilliseconds;
}
这种方法实现起来有点儿复杂。首先, 在数据库里新建一个自定义类型,继承Table类型的,然后建立Stored Procedure,将刚建立的自定义类型作为参数传入。关键点在这里了:使用insert into ... select ... from ...这个语句来实现批量插入。最后就剩下在ADO.Net中调用这个存储过程,将DataTable作为参数传入就大功告成了。
PS. 可能有人要说,DataAdapter不是提供了一个Update的方法,可以实现批量Insert、Delete、Update 的么?但其实DataAdapter的这种做法跟逐条逐条sql语句输入数据库然后执行没什么区别,甚至更慢。还是上面提供的这两种方法可以从根本上提升批量插入的性能。