任务调治与CPU,SQLOS任务调治算法

 

–voluntarily yield便是SOS_SCHEDULER_YIELD等待的原因,发生这类yield的场景:

select * from sys.dm_os_tasks where session_id=63 order by 7

  2.4 Yielding

               
Yelding就是所有逻辑scheduler上运行的Worker都是非抢占式的,
在 Scheduler上Worker由于资源等待,让出给其它Worker就叫Yielding。

    下面讲述几种发生的状态:

    1. 当Woker在Scheduler上运行了超过4ms,就做Yielding。

    2. 每做64k的结果集的排序,就会做一次Yielding。

    3.
做语句Complie编译的过程中,这个过程比较占CPU资源时,经常会有Yielding等。

–对于每个Scheduler,会有一字段load_factor来表示scheduler的繁忙程度,从而动态地将新Worker分配给负载最小的Scheduler,但对于同一个连接,SQL Server会记住该连接最后一个worker使用的scheduler_id,并尽可能为该连接上后续的worker分配给同一个scheduler(为了减小查找最小负载scheduler的开销),但如果该scheduler上负载大于所有scheduler负载平均值的20%,SQL Server会为新worker分配负载最低的scheduler。

using System;
using System.Diagnostics;
namespace WORKER
{
    class Program
    {
        static void Main(string[] args)
        {
            for(int i=0; i<256; i++)
            {
                OpenConnection();
            }
        }
        static void OpenConnection()
        {
            ProcessStartInfo startInfo = new ProcessStartInfo();
            startInfo.FileName = "sqlcmd.exe";
            startInfo.Arguments = " -E -S SERVERNAME -d TEST -q \" SELECT * FROM TEST \"";
            Process.Start(startInfo);
        }
    }
}

三. 使用dmv任务查看

   3.1.  通过sys.dm_os_sys_info 查看scheduler与cpu的关系如下:

 SELECT cpu_count,max_workers_count,scheduler_count FROM sys.dm_os_sys_info

  图片 1

  3.2  查看最大Worker数  

select max_workers_count from sys.dm_os_sys_info  

  3.3  查看Task与Worker关系

--在每一个连接里,我们可能会有很多batch,分解成多个task以支持如并行查询
 select task_address,task_state,scheduler_id,session_id,worker_address  
 from sys.dm_os_tasks  where session_id>50

select state,last_wait_type,tasks_processed_count,task_address, worker_address, scheduler_address
 from sys.dm_os_workers where  worker_address  =0x00000000043621A0

 图片 2

  3.4 查看Scheduler

--scheduler_id<255 代表用户CPU,相反代表SYSTEM SCHEDULER
SELECT
    scheduler_id,
    cpu_id,
    is_online,
    current_tasks_count,
    runnable_tasks_count,
    current_workers_count,
    active_workers_count,
    work_queue_count
  FROM sys.dm_os_schedulers
  WHERE scheduler_id < 255

  cpu_id:关联的cpu 。 CPU ID  >=255
这类Scheduler都用于系统内部使用。比如说资源管理、DAC、备份还原操作等。

   is_online: 0 调度器离线,1 在线。

  current_tasks_count:当前任务数,状态包括:(等待,运行,已完成)。

  runnable_tasks_count:以分配任务,并在可运行队列中等待被调度的任务数,使用率不高的情况下,这个值会是0。

  current_workers_count:此scheduler关联的线程数。包括处于空闲状态的线程work。

  active_workers_count:当前处理活动的线程数,它必须关联任务task,包括running,runnable,suspend。

  work_queue_count:队列中的任务task等待数,如果不为0,意味着线程用尽的压力。

       讲到这里,后面讲讲CPUf过高的分析…

 

参考文献:

  Troubleshooting SQL Server Scheduling and
Yielding

  Microsoft SQL Server企业级平台管理实践

  How It Works: SQL Server 2012 Database Engine Task
Scheduling

 

 图片 3

【应用】

  2.3  Task

    在Worker上运行的最小任务单元。最简单的Task就是一个简单的Batch,当一个会话发出一个请求时,Sql
server会把这个请求拆分一个或多个任务(Tasks),然后关联对应个数的工作者线程(worker
thread)。

              例如下面是二个Task
,二个Task可能不是同一个Worker。二个Worker也可能不是同一个Scheduler.    
       

select @@servername
Go
select getdate()
GO

   每个Task线程都有3个状态:

    Running:
一个处理器在某个时间只能做一件事情,当一个线程正在一个处理器上运行时,这个线程的状态就是running。

    Suspended:
没有足够资源时,当前线程放弃占有处理器,变成挂起状态。

    Runnable:
一个线程已完成了等待,但还没有轮到它运行,就会变成runnable状态,这种信号等待(signal
wait)

–读取数据页时

一个客户端connection可能包含一个或多个BATCH,一般SQL
Server引擎会为一个BATCH视为一个TASK,但使用并行化查询的BATCH会被分解成多个TASK。具体BATCH怎么分解成TASK,以及分解成多少个,则是由SQL
Server内部决定的。但是在这里我们依然可以使用相关DMV探寻一下大致分配情况:

  2.5  Task在调度运行图如下:

             
 图片 4  

  1. 当 Task 是Runnig时,它是Schedler的活动Worker。
  2. 当 Task只等待CPU运行时,它被放入Schedler可运行的队列中。
  3. 当 Task
    在等待某个资源时(比如锁、磁盘输入/输出等)时,它处于“Suspended挂起状态”
    状态。
  4. 如果Task Scheduler挂起状态完成了等待,那么它就会被放到Scheduler
    的Runnable队列的末尾。
  5. 如果运行线程自动Yidlding让步,则将其放回Scheduler
    的Runnable队列的末尾。
    6.
    如果运行的线程需要等待某个资源,它将被调出Scheduler调度器并进入挂起状态Waiter
    list。
    7.
    如果正在运行的线程完成它的工作,那么Runnable队列的顶部的第一个线程就变成了“运行”线程。

    

–当特定Scheduler修改为离线时,会将该Scheduler转移到其他CPU上,并阻止为其再分配Worker,当该Scheduler上所有Worker执行完毕后,Scheduler转为离线。

SQL SERVER SQLOS的任务调度

  2.5 调度关系图如下:

           
  图片 5

参考:

【关系】

  2.2  Worker

     Worker又称为WorkerThread,每个Worker跟一个线程,是Sql
server任务的执行单位。 多个Worker对应一个Scheduler,公式Workers=max
worker threads/onlines
scheduler。在一个Scheduler上,同一时间只能有一个Worker运行。例如4个处理器的64位操作系统,它的每个Scheduler的Worker是512/4=128。

–Task是SQL Sever 调度管理器中最小的任务单元,运行于Workder之上,只有获取Worker的Task才能运行。

我们了解了SQL
SERVER任务调度的机制,那么有些问题,就会更加清楚。

二.调度原理

 

然后执行下面的程序。下面的程序会开启256个连接到SQL
Server, 这256个连接由于前面的transaction未闭合,都处于BLOCKING状态。

二. CPU 的配置

    在Sql server
里点击数据库实例右键到属性,选择处理器进行配置。最大工作线程数的默认值是0
注意这里配置的是worker它是对CPU的真正封装)。这使得SQL
Server能够在启动时自动配置工作线程的数量。默认设置对于大多数系统是最好的。但是,根据您的系统配置,将最大工作线程数设置为一个特定的值有时会提高性能。当查询请求的实际数量小于最大工作线程数时,一个线程处理一个查询请求。但是,如果查询请求的实际数量超过最大线程量时,SQLServer会将Worker
Threads线程池化,以便下一个可用的工作线程可以处理请求。

      配置如下图所示:

     
  图片 6

          也可以通过T-sql配置,下例通过sp_configure将max
worker线程选项配置为900

USE AdventureWorks2012 ;  
GO  
EXEC sp_configure 'show advanced options', 1;  
GO  
RECONFIGURE ;  
GO  
EXEC sp_configure 'max worker threads', 900 ;  
GO  
RECONFIGURE; 

    Max Worker Threads服务器配置选项不考虑的线程, 像高可用、Service
Broker、 Lock
管理等其它。如果配置的线程数量超过了,下面的查询将提供关于系统任务产生的额外线程信息

       is_user_process = 0 表示系统任务,非用户任务。

SELECT  s.session_id, r.command, r.status,  r.wait_type, r.scheduler_id, w.worker_address,  
w.is_preemptive, w.state, t.task_state,  t.session_id, t.exec_context_id, t.request_id  
FROM sys.dm_exec_sessions AS s  
INNER JOIN sys.dm_exec_requests AS r  
ON s.session_id = r.session_id  
INNER JOIN sys.dm_os_tasks AS t  
ON r.task_address = t.task_address  
INNER JOIN sys.dm_os_workers AS w  
ON t.worker_address = w.worker_address  
WHERE s.is_user_process = 0;

    下面显示每个用户的活动会话数

SELECT login_name ,COUNT(session_id) AS session_count  
FROM sys.dm_exec_sessions 
WHERE status<>'sleeping'
GROUP BY login_name;  

    下表显示了各种CPU和SQLServer组合的最大工作线程的自动配置数量。

Number of CPUs

32-bit computer

64-bit computer

<= 4 processors

256

512

8 processors

288

576

16 processors

352

704

32 processors

480

960

64 processors

736

1472

128 processors

4224

4480

256 processors

8320

8576

    

  根据微软的建议:这个选项是一个高级选项,应该只由经验丰富的数据库管理员或经过认证的SQL
Server专业人员更改。如果您怀疑存在性能问题,则可能不是工作线程的可用性。原因更像是I/O,这会导致工作线程等待。在更改最大工作线程设置之前,最好找到性能问题的根本原因。

2.

图片 7

一. 概述

    我们知道在操作系统看来, sql
server产品与其它应用程序一样,没有特别对待。但内存,硬盘,cpu又是数据库系统最重要的核心资源,所以在sql
server
2005及以后出现了SQLOS,这个组件是sqlserver和windows的中间层,用于CPU的任务调度,解决I/O的资源争用,协调内存管理等其它的资源协调工作。下面我来试着讲讲SQLOS下的Scheduler调度管理。

–每64K结果集排序,就做一次yield。

步骤一:

  2.1 Scheduler任务调度

              Sqlserver
的一个Scheduler对应操作系统上的一个逻辑CPU用于任务分配。调度分配从NUMA节点级别开始。基本算法是一个用于新连接的循环调度。当每个新的连接到达时,它被分配给基于循环的调度器。在相同的NUMA节点内,以最小的负载因子分配给调度器的新连接。

 

图片 8

 

SQL
Server的任务调度使得SQL
SERVER能够以最快方式处理用户发过来的请求。了解SQL
SERVER的任务调度过程,对于我们调整系统性能是非常有帮助的。如适当增加MAX
WORKER
THREAD,调整MAXDOP,去除BLOCKING等等,了解这些概念,会使得我们的调整更有目的性。

–可以使用以下代码来查看

用下面的DMV, 我们可以看到,针对SESSION_ID=58的,只有一个task.
(地址为0x0064F048), 而针对该TASK的worker地址为:
0x803081A0。同时我们也可以看到该worker运行在Scheduler 0上面。

–等待类型中”PREEMPIVE_*”的等待便是由抢占式Task所造成的,该类task包括扩展存储过程+windows API调用+日志填0初始化等

执行下面的脚本,创建一个测试数据库和测试数据表

–基于时间片的voluntarily yield大概使得Worker每秒yield一次。这个值可以通过sys.dm_os_schedulers的quantum_length_us列看到。

最大工作线程数可以通过下面的查询得到。SQL
SERVER并不是一开始就把这些所有的工作线程都创建,而是依据需要而创建。

–如果Worker需要运行一些抢占式的代码,则该worker不能再由SQL OS来控制,而需要转交给Windows任务调度系统来控制,当Worker上抢占式的task运行结束后再交给scheduler来控制。

步骤四:查看连接

图片 9

通常来讲,SCHEDULER个数是跟CPU个数相匹配的。除了几个系统的SCHEDULER以外,每一个SCHEDULER都映射到一个CPU,如下面的查询结果所示,我们有四个CPU,也就有相应四个USER SCHEDULER,而scheduler_total_count有16个则是因为有8个是系统scheduler,我们一般不必关注系统scheduler。

–为提升效率和节约资源,SQL Server使用Worker pool来存放创建的worker,提高其重用率。

图片 10

–如果客户端不能及时取走数据,worker也会做yield

我们使用spid为63的窗口执行一个复杂的查询,此查询使用默认并行度运行(由于有8个CPU因此默认MAXDOP=8)。

–默认设置下,Worker的最大数量有SQL Server进行管理,取决于SQL Server是32位还是64位以及SQL Server使用的CPU数量,DBA也可手动配置Workd的最大数量。

从下面的查询可以知道,这个WORKER已经执行了5291个task了。这个worker相应的Scheduler地址是0x00932080

–对于大于的Scheduler用于系统专用,如死锁检测,CheckPoint, LazyWriter等

图片 11

SQL OS使用Worker自己yield的方式来实现context switch,该switch提升了并发性,同时与windows的线程switch相比又减少了资源开销。

步骤五:查看batch

–batch中每一句话做完,就会做一次yield。

这是因为WORKER用完的缘故。新的连接无法获得一个WORKER来做login
process。所以导致连接失败。在群集环境下,如果连接不上SQL Server,
ISALIVE检查会失败,会引起SQL Server
FAILOVER。所有的连接都会被强迫中止,并且SQL
Server会在新结点上重新启动。针对这种情况,我们可以修改提高MAX WORKER
THREAD,但是并不能最终解决问题,由于BLOCKING缘故,新的连接会迅速积累,一直把MAX
WORKER
THREAD用完,所以这时候,我们应该检查BLOCKING。使得task能及时完成,释放WORKER。

 

步骤八:查看SCHEDULER

WHERE S.scheduler_id<255

WORKER(又称为WORKER
THREAD), 则是工作线程。在一台服务器上,我们可以有多个工作线程。因为每一个工作线程要耗费资源,所以,SQL
Server有一个最大工作线程数。

–语句complie,会做yield。

对于很大的SPID编号,通常表明,我们的WORKER数是很高的。这种情况比较危险,如果一个新的连接进来,可能没有空闲WORKER来处理这个连接。在CLUSTER环境下,ISALIVE检查会失败,会导致SQL
SERVER做FAILOVER。

–当Worker空闲超过15分钟或系统面临内存压力时,SQL Server会尝试释放Worker来回收内存,在32位系统下,每个Worker至少占用0.5MB内存,在64位系统下,每个Worker至少占用2MB内存。

SQL
Server上,每一个CPU通常会对应一个Scheduler,有几个额外的系统的Scheduler,只是用来执行一些系统任务。对用户来讲,我们只需要关心User
Scheduler就可以了。如果有4个CPU的话,那么通常就会有4个User
Scheduler。

–由于SQL Server使用合作的线程调度模式,如果某一个Worker长期占用scheduler就会导致该scheduler上其他runable的worker长时间得不到运行,因此需要SQL Server根据一定策略来将该worker切换出来让其他worker得以运行。Worker切换出来的过程称之为yield,yield可大致分为两种:

原文网址如下:

 

每个Scheduler上,可以有多个worker对应。Worker是真正的执行单元,Scheduler(对CPU的封装)是执行的地方。Worker的总数受max
worker
thread限制。每一个worker在创建的时候,自己需要申请2M内存空间。如果max
worker
thread为1024,并且那些worker全部创建的话,至少需要2G空间。所以太多的worker,会占用很多系统资源。

–在SQL SERVER中,Scheduler并不直接调用线程处理,而是使用Worker 来承载负载,在特定时刻,一个Scheduler上只能有一个Worker处于运行状态。随着数据库的负载变化,SQL Server会增加或释放Workder。

从下面的查询来看,我们的连接对应的SPID是58,被block住了。

SELECT *
FROM sys.dm_os_schedulers S

步骤七:查看WORKER

–SQL SERVER OS 采用合作模式的线程调度模式,即除非Worker主动放弃CPU,否则SQL OS 不会强制剥夺其CPU,从而减少Context Switch

打开一个查询窗口,执行下面的语句,注意,我们这里并没有commit
transaction.

1.SQL SERVER
2005技术内幕:存储引擎

NON-YIELDING
SCHEDULER错误。我们有时候会看到SQL
Server会报一个17883错误, NON-YIELDING
SCHEDULER。这个错误指的是,在一个SCHEDULER上,会有多个WORKER,它们以友好的方式,互相占用一会儿SCHEDULER资源。某个WORKER占用SCHEDULER后,执行一段时间,会做YIELD,也就是退让,把SCHEDULER资源让出来,让其他WORKER去使用。如果某一个WORKER出于某种原因,不退让SCHEDULER资源,导致其他WORKER没有机会运行,这种现象叫NON-YIELDING
SCHEDULER。出现这种情况,SQL
SERVER有自动检测机制,会打一个DUMP出来。我们需要进一步分析DUMP为什么该WORKER不会YIELD。

  1. worker在运行中需要等待获取其他资源而被造成阻塞,在阻塞发生时却换,称为natual yield;

  2. worker在长时间运行或某个阶段结束时发生却换,称为voluntarily yield;

在了解Connection,
Batch, Task, Worker, Scheduler,
CPU之间的关系后,下面我们用DMV跟踪一下运作的流程。

在高并发下,需要worker频繁地从running状态却换到waiting状态,以实现各请求的快速响应,每次却换即一次switch.

结果如下:

 

我们初步了解了Connection,
Batch, Task, Worker, Scheduler,
CPU这些概念,那么,它们之间的关系到底是怎么样呢?

–默认设置下,SQL SERVER 创建与逻辑CPU数量相同的Scheduler,但Scheduler并不与CPU硬性绑定直到DBA指定Process Affinity,通过配置Process Affinity(修改关联掩码)来使指定CPU对应的Scheduler离线或联机。

步骤六:查看TASK

–在负载严重或Scheduler被离线时,一个CPU可能对应多个Scheduler。

从下面的查询可以得知,Scheduler_address
(0x00932080) 相应的CPU_ID是0。在我们的系统上,有4个CPU, 编号分别为0, 1, 2, 3. 但是有7个SCHEDULER, 其中3个是SYSTEM
SCHEDULER, 4个是USER
SCHEDULER。在每个SCHEDULER上,有相应的WORKER数目。因为WORKER是根据需要而创建的,所以,在每个SCHEDULER上,目前WORKER数目很少。而且其中有些WORKER还处于SLEEPING状态。

–对于同一连接发送来的多个Bacth,SQL Sever倾向于交给同一个Task来处理,但也可能交给不同的Worker,运行在不同的schduler上。

图片 12

 

(33 行受影响)
task_address       task_state  context_switches_count pending_io_count pending_io_byte_count pending_io_byte_average scheduler_id session_id exec_context_id request_id  worker_address     host_address       parent_task_address
------------------ ---------------------------------- ---------------- --------------------- ----------------------- ------------ ---------- --------------- ----------- ------------------ ------------------ -------------------
0x000000000DB29468 SUSPENDED   4696                   510              0                     0                       0            63         7               0           0x0000000032E02160 0x0000000000000000 0x0000000025E67468
0x000000000DB29088 SUSPENDED   1457                   290              0                     0                       0            63         11              0           0x0000000017FE2160 0x0000000000000000 0x0000000025E67468
0x0000000012358CA8 RUNNING     1937                   1945             0                     0                       0            63         21              0           0x0000000034E84160 0x0000000000000000 0x0000000025E67468
0x0000000012359088 SUSPENDED   2                      0                0                     0                       0            63         32              0           0x000000000685A160 0x0000000000000000 0x0000000025E67468
0x000000000F20D468 SUSPENDED   4489                   510              0                     0                       1            63         4               0           0x000000001FE30160 0x0000000000000000 0x0000000025E67468
0x0000000035F19468 SUSPENDED   1731                   290              0                     0                       1            63         16              0           0x00000002BD8DC160 0x0000000000000000 0x0000000025E67468
0x0000000035F19088 SUSPENDED   2280                   1864             0                     0                       1            63         23              0           0x000000001AA60160 0x0000000000000000 0x0000000025E67468
0x0000000035F18CA8 SUSPENDED   9                      0                0                     0                       1            63         28              0           0x00000002BB60A160 0x0000000000000000 0x0000000025E67468
0x000000002E283468 SUSPENDED   4485                   510              0                     0                       2            63         5               0           0x000000001FE48160 0x0000000000000000 0x0000000025E67468
0x000000001A736108 SUSPENDED   1700                   290              0                     0                       2            63         15              0           0x00000000310C6160 0x0000000000000000 0x0000000025E67468
0x000000001A737468 RUNNING     2256                   1865             0                     0                       2            63         20              0           0x00000000049DC160 0x0000000000000000 0x0000000025E67468
0x000000001A737848 SUSPENDED   5                      0                0                     0                       2            63         30              0           0x0000000018390160 0x0000000000000000 0x0000000025E67468
0x000000001A609088 SUSPENDED   3973                   510              0                     0                       3            63         8               0           0x000000001BEC0160 0x0000000000000000 0x0000000025E67468
0x0000000014A49848 SUSPENDED   1652                   290              0                     0                       3            63         14              0           0x0000000017436160 0x0000000000000000 0x0000000025E67468
0x0000000014A49088 RUNNING     2058                   1878             0                     0                       3            63         18              0           0x0000000025D2C160 0x0000000000000000 0x0000000025E67468
0x000000000FD5C108 SUSPENDED   6                      0                0                     0                       3            63         26              0           0x00000000213DA160 0x0000000000000000 0x0000000025E67468
0x0000000025E67468 SUSPENDED   3                      0                0                     0                       4            63         0               0           0x00000000353A6160 0x0000000000000000 NULL
0x0000000006EC9C28 SUSPENDED   4469                   510              0                     0                       4            63         6               0           0x000000002AF14160 0x0000000000000000 0x0000000025E67468
0x000000001C0708C8 SUSPENDED   1725                   290              0                     0                       4            63         13              0           0x000000002AC74160 0x0000000000000000 0x0000000025E67468
0x000000001C0704E8 RUNNING     2324                   1889             0                     0                       4            63         24              0           0x000000001497A160 0x0000000000000000 0x0000000025E67468
0x0000000012035468 SUSPENDED   5                      0                0                     0                       4            63         29              0           0x00000002B70E6160 0x0000000000000000 0x0000000025E67468
0x00000002BB1144E8 SUSPENDED   4084                   511              0                     0                       5            63         1               0           0x0000000028F4E160 0x0000000000000000 0x0000000025E67468
0x00000002BB115C28 SUSPENDED   1775                   290              0                     0                       5            63         12              0           0x000000000E7B4160 0x0000000000000000 0x0000000025E67468
0x00000002BB115468 RUNNABLE    2256                   1830             0                     0                       5            63         22              0           0x000000000AC4C160 0x0000000000000000 0x0000000025E67468
0x000000000BBA5848 SUSPENDED   5                      0                0                     0                       5            63         27              0           0x000000002ABFC160 0x0000000000000000 0x0000000025E67468
0x00000000263BFC28 SUSPENDED   5031                   510              0                     0                       6            63         2               0           0x000000002E444160 0x0000000000000000 0x0000000025E67468
0x00000002BE5D6108 SUSPENDED   1856                   290              0                     0                       6            63         10              0           0x00000002BF20E160 0x0000000000000000 0x0000000025E67468
0x0000000020446CA8 RUNNING     2275                   1936             0                     0                       6            63         19              0           0x0000000005104160 0x0000000000000000 0x0000000025E67468
0x0000000020446108 SUSPENDED   5                      0                0                     0                       6            63         31              0           0x0000000022F9E160 0x0000000000000000 0x0000000025E67468
0x000000003193B468 SUSPENDED   4276                   510              0                     0                       7            63         3               0           0x000000002B58C160 0x0000000000000000 0x0000000025E67468
0x000000003193A8C8 SUSPENDED   1806                   290              0                     0                       7            63         9               0           0x000000001FCEA160 0x0000000000000000 0x0000000025E67468
0x000000000E2A2CA8 SUSPENDED   2308                   2007             0                     0                       7            63         17              0           0x00000000113AE160 0x0000000000000000 0x0000000025E67468
0x000000000E2A28C8 SUSPENDED   10                     0                0                     0                       7            63         25              0           0x000000002504C160 0x0000000000000000 0x0000000025E67468

WORKER 用完。我们可以做一个小实验。我们在一台32位机器上,创建上面提及的测试数据库,并且,开启一个同样的未关闭transaction的update语句。

前些天在处理一个SQL
Server
LATCH导致的数据库停止响应问题时,遇到了一些需要SQLOS调度知识解决的问题,正好以前看过一篇官网的文章,在这里稍作修改贴出来。

步骤三:

在每一个连接里,我们可能会有很多batch,在一个连接里,batch都是按顺序的。只有一个batch执行完了,才会执行下面一个batch。因为有很多连接,所以从SQL
Server层面上看,同时会有很多个batch。

从上图我们可以看到,来自客户端的一个BACTH由于并行查询而被分解成了33个TASK,对应33个task_address,和33个worker_address,这说明一个BATCH占用了33个worker
threads,这个数目是相当大的。由于本例中USER
SCHEDULER的数目是8,因此默认MAXDOP也是8,所以我们看到有编号为0-7的8个scheduler_id,其中scheduler_id为4的CPU被5个task占用,这5个task当中有一个parent_task_address为NULL,说明这个task是整个BATCH的主task。其他7个CPU上都只有4个task。如果观察时间更长一点我们还会发现,同一个CPU上的4个task只有exec_context_id倒数第二大的task是一直处于running状态的,其他的全部是处于占用worker
thread的suspended状态。

图片 13

select cpu_count,max_workers_count from sys.dm_os_sys_info
CREATE DATABASE TEST
go
use TEST
go
CREATE TABLE TEST(ID int,name nvarchar(50))
INSERT INTO TEST VALUES (1, 'aaa')
select cpu_count,scheduler_count,scheduler_total_count from sys.dm_os_sys_info

图片 14

SELECT * FROM TEST

打开另外一个窗口,执行下面的语句,我们会看到,下面的查询会一直在执行,因为我们前面的一个transaction并没有关闭。从查询窗口,我们可以看到,下面语句执行的SPID为58

SQL
Server在通过BATCH,TASK,WORKER,SCHEDULER等来对任务进行调度和处理。了解这些概念,对于了解SQL
Server内部是如何工作,是非常有帮助的。

【介绍】

我们查看SQL
Profiler, 看到我们的Batch是SELECT * FROM TEST

【总结】 

begin tran
update TEST set name='bbb' where [ID] = 1

步骤二:

图片 15

如上图所示,左边是很多连接,每个连接有一个相应的SPID,只要用户没有登出,或者没有timeout,这个始终是存在的。标准设置下,对于用户连接数目,是没有限制的。

Number of CPUs

32bit

64 bit

<=4 processors

256

512

8 processors

288

576

16 processors

352

704

32 processors

480

960

这时候,我们新开启一个连接,会发现SQL Server连不上,并报如下错误:

【跟踪】

图片 16

设置MAXDOP的作用。MAXDOP=1的话,可以使得一个BATCH只对应一个TASK。如果一个BATCH产生多个TASKS,那么TASK之间的协调,等待等等,将是很大的开销。把MAXDOP设小,能同时减少WORKER的使用量。所以,如果我们看到等待类型为CXPACKET的话,那么我们可以设置MAXDOP,减少并行度。

查询SELECT * FROM sys.dm_os_tasks这时候我们发现有278个TASK,而查询sys.dm_os_schedulers 我们发现有两个CPU, 因此有两个用户SCHEDULER, 每个SCHEDULER上,有128个workers. 加起来有256个WORKERS。针对两个CPU的架构,我们缺省最大的WORKER数是256。所以已经到了极限了。

SQL
Server会做优化,每一个batch,可能会分解成多个task以支持如并行查询。这样,在SQL层面上来看,同时会有很多个TASK。

比较大的SPID。如果我们看到SPID的号码非常大,如超过1000,那么通常表明,我们系统有很严重的BLOCKING。SQL
SERVER不对连接数做限制,但是对于WORKER数,是有限制的。缺省情况下,最大个数如下:

图片 17

TASK是worker的使用者,每个TASK系统会给它分配一个工作线程进行处理,是一对一的关系但并不绑定。如果所有的工作线程都在忙,而且已经达到了最大工作线程数,SQL
Server就要等待,直到有一个忙的工作线程被释放。

相关文章

发表评论

电子邮件地址不会被公开。 必填项已用*标注

*
*
Website