IT博客汇
  • 首页
  • 精华
  • 技术
  • 设计
  • 资讯
  • 扯淡
  • 权利声明
  • 登录 注册

    [C#]async和await刨根问底 - VD630

    VD630发表于 2015-06-24 08:36:00
    love 0

    上一篇随笔留下了几个问题没能解决:
    · 调用IAsyncStateMachine.MoveNext方法的线程何时发起的?
    · lambda的执行为何先于MoveNext方法?
    · 后执行的MoveNext方法做了些什么事情?

    那么今天就来尝试解决它们吧~
    PS: 本文中部分代码来自上一篇随笔,具体来源可参考注释中的章节标题

    一、哪里来的线程?

    通过上一篇随笔的调查我们知道了,async标记的方法的方法体会被编译到一个内部结构体的MoveNext方法中,并且也找到了MoveNext的调用者,再且也证实了有两个调用者是来自于主线程之外的同一个工作线程。
    可是这一个线程是何时发起的呢?上一次调查时没能找到答案,这一次就继续从MoveNext方法开始,先找找看Task相关的操作有哪些。

    1 // 三、理解await
    2 bool '<>t__doFinallyBodies';
    3 Exception '<>t__ex';
    4 int CS$0$0000;
    5 TaskAwaiter<string> CS$0$0001;
    6 TaskAwaiter<string> CS$0$0002;
    7
    8 try
    9 {
    10 '<>t__doFinallyBodies' = true;
    11 CS$0$0000 = this.'<>1__state';
    12 if (CS$0$0000 != 0)
    13 {
    14 CS$0$0001 = this.'<>4__this'.GetHere().GetAwaiter();
    15 if (!CS$0$0001.IsCompleted)
    16 {
    17 this.'<>1__state' = 0;
    18 this.'<>u__$awaiter1' = CS$0$0001;
    19 this.'<>t__builder'.AwaitUnsafeOnCompleted(ref CS$0$0001, ref this);
    20 '<>t__doFinallyBodies' = false;
    21 return;
    22 }
    23 }
    24 else
    25 {
    26 CS$0$0001 = this.'<>u__$awaiter1';
    27 this.'<>u__$awaiter1' = CS$0$0002;
    28 this.'<>1__state' = -1;
    29 }
    30
    31 Console.WriteLine(CS$0$0001.GetResult());
    32 }

    注意到14行的GetHere方法返回了一个Task<string>,随后的GetAwaiter返回的是TaskAwaiter<string>。
    不过这两个Get方法都没有做什么特别的处理,那么就看看接下来是谁使用了TaskAwaiter<string>实例。
    于是就来看看19行的AsyncVoidMethodBuilder.AwaitUnsafeOnCompleted里面做了些什么吧。

    1 // System.Runtime.CompilerServices.AsyncVoidMethodBuilder
    2 [__DynamicallyInvokable, SecuritySafeCritical]
    3 public void AwaitUnsafeOnCompleted<TAwaiter, TStateMachine>(
    4 ref TAwaiter awaiter, ref TStateMachine stateMachine)
    5 where TAwaiter : ICriticalNotifyCompletion
    6 where TStateMachine : IAsyncStateMachine
    7 {
    8 try
    9 {
    10 Action completionAction = this.m_coreState
    11 .GetCompletionAction<AsyncVoidMethodBuilder, TStateMachine>(ref this, ref stateMachine);
    12 awaiter.UnsafeOnCompleted(completionAction);
    13 }
    14 catch (Exception exception)
    15 {
    16 AsyncMethodBuilderCore.ThrowAsync(exception, null);
    17 }
    18 }

    这里主要做了两件事:
    一是创建了一个Action,MoveNext方法的信息已经随着stateMachine被封装进去了。
    二是把上面这个Action交给Awaiter,让它在await的操作完成后执行这个Action。

    先来看看Action的构建细节吧:

    1 // System.Runtime.CompilerServices.AsyncMethodBuilderCore
    2 [SecuritySafeCritical]
    3 internal Action GetCompletionAction<TMethodBuilder, TStateMachine>(ref TMethodBuilder builder, ref TStateMachine stateMachine)
    4 where TMethodBuilder : IAsyncMethodBuilder
    5 where TStateMachine : IAsyncStateMachine
    6 {
    7 Debugger.NotifyOfCrossThreadDependency();
    8 ExecutionContext executionContext = ExecutionContext.FastCapture();
    9 Action action;
    10 AsyncMethodBuilderCore.MoveNextRunner moveNextRunner;
    11 if (executionContext != null && executionContext.IsPreAllocatedDefault)
    12 {
    13 action = this.m_defaultContextAction;
    14 if (action != null)
    15 {
    16 return action;
    17 }
    18 moveNextRunner = new AsyncMethodBuilderCore.MoveNextRunner(executionContext);
    19 action = new Action(moveNextRunner.Run);
    20 if (AsyncCausalityTracer.LoggingOn)
    21 {
    22 action = (this.m_defaultContextAction = this.OutputAsyncCausalityEvents<TMethodBuilder>(ref builder, action));
    23 }
    24 else
    25 {
    26 this.m_defaultContextAction = action;
    27 }
    28 }
    29 else
    30 {
    31 moveNextRunner = new AsyncMethodBuilderCore.MoveNextRunner(executionContext);
    32 action = new Action(moveNextRunner.Run);
    33 if (AsyncCausalityTracer.LoggingOn)
    34 {
    35 action = this.OutputAsyncCausalityEvents<TMethodBuilder>(ref builder, action);
    36 }
    37 }
    38 if (this.m_stateMachine == null)
    39 {
    40 builder.PreBoxInitialization<TStateMachine>(ref stateMachine);
    41 this.m_stateMachine = stateMachine;
    42 this.m_stateMachine.SetStateMachine(this.m_stateMachine);
    43 }
    44 moveNextRunner.m_stateMachine = this.m_stateMachine;
    45 return action;
    46 }

    这段的分支有点多,行号上的标记是我DEBUG时经过的分支。
    可以看到,这个方法里面出现了MoveNext方法的调用者MoveNextRunner,它的Run方法被封装到了返回的Action里。
    也就是说,只要这个Action被执行,就会进入Run方法,而Run方法里面有两条分支,简单来说就是:
    1.直接调用MoveNext
    2.通过InvokeMoveNext调用MoveNext

    第40行的赋值不影响Action中的Run,只是在头尾追加了状态记录的操作。
    接下来就赶紧找一找执行这个Action的地方吧!
    深入UnsafeOnCompleted方法,最终可以找到如下的方法,第一个参数就是要跟踪的对象:

    1 // System.Threading.Tasks.Task
    2 [SecurityCritical]
    3 internal void SetContinuationForAwait(
    4 Action continuationAction,
    5 bool continueOnCapturedContext,
    6 bool flowExecutionContext,
    7 ref StackCrawlMark stackMark)
    8 {
    9 TaskContinuation taskContinuation = null;
    10 if (continueOnCapturedContext)
    11 {
    12 SynchronizationContext currentNoFlow = SynchronizationContext.CurrentNoFlow;
    13 if (currentNoFlow != null && currentNoFlow.GetType() != typeof(SynchronizationContext))
    14 {
    15 taskContinuation = new SynchronizationContextAwaitTaskContinuation(
    16 currentNoFlow, continuationAction, flowExecutionContext, ref stackMark);
    17 }
    18 else
    19 {
    20 TaskScheduler internalCurrent = TaskScheduler.InternalCurrent;
    21 if (internalCurrent != null && internalCurrent != TaskScheduler.Default)
    22 {
    23 taskContinuation = new TaskSchedulerAwaitTaskContinuation(
    24 internalCurrent, continuationAction, flowExecutionContext, ref stackMark);
    25 }
    26 }
    27 }
    28 if (taskContinuation == null && flowExecutionContext)
    29 {
    30 taskContinuation = new AwaitTaskContinuation(continuationAction, true, ref stackMark);
    31 }
    32 if (taskContinuation != null)
    33 {
    34 if (!this.AddTaskContinuation(taskContinuation, false))
    35 {
    36 taskContinuation.Run(this, false);
    37 return;
    38 }
    39 }
    40 else if (!this.AddTaskContinuation(continuationAction, false))
    41 {
    42 AwaitTaskContinuation.UnsafeScheduleAction(continuationAction, this);
    43 }
    44 }

    同样的,行号的标记意味着经过的分支。继续跟进:

    1 // System.Threading.Tasks.AwaitTaskContinuation
    2 [SecurityCritical]
    3 internal static void UnsafeScheduleAction(Action action, Task task)
    4 {
    5 AwaitTaskContinuation awaitTaskContinuation = new AwaitTaskContinuation(action, false);
    6 TplEtwProvider log = TplEtwProvider.Log;
    7 if (log.IsEnabled() && task != null)
    8 {
    9 awaitTaskContinuation.m_continuationId = Task.NewId();
    10 log.AwaitTaskContinuationScheduled(
    11 (task.ExecutingTaskScheduler ?? TaskScheduler.Default).Id,
    12 task.Id,
    13 awaitTaskContinuation.m_continuationId);
    14 }
    15 ThreadPool.UnsafeQueueCustomWorkItem(awaitTaskContinuation, false);
    16 }
    1 // System.Threading.ThreadPool
    2 [SecurityCritical]
    3 internal static void UnsafeQueueCustomWorkItem(IThreadPoolWorkItem workItem, bool forceGlobal)
    4 {
    5 ThreadPool.EnsureVMInitialized();
    6 try
    7 {
    8 }
    9 finally
    10 {
    11 ThreadPoolGlobals.workQueue.Enqueue(workItem, forceGlobal);
    12 }
    13 }

    这里出现了全局线程池,然而没有找到MSDN对ThreadPoolGlobals的解释,这里头的代码又实在太多了。。。暂且模拟一下看看:

    1 Console.WriteLine("HERE");
    2 var callback = new WaitCallback(state => Println("From ThreadPool"));
    3 ThreadPool.QueueUserWorkItem(callback);
    4 Console.WriteLine("THERE");

    QueueUserWorkItem方法内部调用了ThreadPoolGlobals.workQueue.Enqueue,运行起来效果是这样的:

    HERE
    THERE
    From ThreadPool

    再看看线程信息:

    Function: CsConsole.Program.Main(), Thread: 0x2E58 主线程
    Function: CsConsole.Program.Main(), Thread:
    0x2E58 主线程
    Function: CsConsole.Program.Main.AnonymousMethod__6(
    object), Thread: 0x30EC 工作线程

    和async的表现简直一模一样是不是~?从调用堆栈也可以看到lambda的执行是源于这个workQueue:

    到此为止算是搞定第一个问题了。

    二、lambda为何先行?

    先来回忆一下GetHere方法的内容:

    // 三、理解await
    Task<string> GetHere()
    {
    return Task.Run(() =>
    {
    Thread.Sleep(
    1000);
    return "HERE";
    });
    }

    要追踪的lambda就是在这里构造的,而调用GetHere的地方也只有一个,就是MoveNext方法的try块。
    而MoveNext的调用方也都找出来了:

    其中Start方法是在主线程中调用的,可以由SampleMethod追溯到。那么以下的调用信息:

    Function: Test.Program.Main(string[]), Thread: 0xE88 主线程
    Function: Test.Program.GetHere.AnonymousMethod__3(), Thread:
    0x37DC 工作线程
    Function: System.Runtime.CompilerServices.AsyncMethodBuilderCore.MoveNextRunner.Run(), Thread:
    0x37DC 工作线程
    Function: System.Runtime.CompilerServices.AsyncMethodBuilderCore.MoveNextRunner.InvokeMoveNext(
    object), Thread: 0x37DC 工作线程

    这个顺序不是有点奇怪吗?lambda怎么能先于MoveNextRunner的两个方法执行?
    其实我在这里犯了一个很明显的思维错误。。。Start调用来自主线程,lambda调用来自子线程,于是直觉性地否定了它们之间的关联。。。
    很显然,整个过程其实应该是这样的:
    1. 主线程:Start方法调用了MoveNext,MoveNext调用了GetHere
    2. 主线程:GetHere方法返回了包含lambda信息的Task
    3. 主线程:Task经过变换与包装,最终进入了线程池
    4. 子线程:通过Task调用了lambda
    5. 子线程:通过Runner调用了MoveNext

    子线程中的lambda是来源于主线程第一次调用的MoveNext,和之后的Run啊InvokeMoveNext是没有关系的,所以这个顺序也就不奇怪了。
    通过DEBUG几个关键点即可以验证这一顺序。第二个也算搞定了。

    三、MoveNext干了什么?

    第二个问题虽然解决了,但是也让第三个问题显得更加重要,既然lambda确实是先于MoveNext,那么MoveNext到底做了些什么?
    通过之前的调查,现在知道了:
    1. MoveNext在lambda执行之前被Start方法在主线程调用了一次,过程中把lambda封送给了线程池
    2. MoveNext在lambda执行之后被InvokeMoveNext又调用了一次,这一次做了什么处理是尚不明了的

    回头看本文的第一段代码,前后两次进入同一段代码,但是做了不同的事情,那么显然就是两次走了不同的分支咯。
    由于这段代码本身是DEBUG不进去的,所以只能在其内部调用的方法里断点了。我打了如下几个断点:
    · Task<TResult>.GetAwaiter
    · AsyncVoidMethodBuilder.AwaitUnsafeOnCompleted
    · TaskAwaiter<TResult>.GetResult
    · Program.SampleMethod
    · MoveNextRunner.InvokeMoveNext

    来看看执行结果如何吧:

    Function: Test.Program.SampleMethod(), Thread: 0x9BC 主线程
    Function: System.Threading.Tasks.Task
    <TResult>.GetAwaiter(), Thread: 0x9BC 主线程
    Function: System.Runtime.CompilerServices.AsyncVoidMethodBuilder.AwaitUnsafeOnCompleted
    <TAwaiter,TStateMachine>(ref TAwaiter, ref TStateMachine), Thread: 0x9BC 主线程
    Function: System.Runtime.CompilerServices.AsyncMethodBuilderCore.MoveNextRunner.InvokeMoveNext(
    object), Thread: 0x3614 工作线程
    Function: System.Runtime.CompilerServices.TaskAwaiter
    <TResult>.GetResult(), Thread: 0x3614 工作线程

    需要注意的是,断到InvokeMoveNext里头的时候,只有这一行代码:

    ((IAsyncStateMachine)stateMachine).MoveNext();

    而当我按下F11步入之后,可以猜一猜跳到了哪:

    async void SampleMethod()
    {
    Console.WriteLine(
    await GetHere());
    }

    而在这个时候GetResult还没执行到。
    由此可以整理出try块里的执行过程如下:

    1 try
    2 {
    3 '<>t__doFinallyBodies' = true;
    4 CS$0$0000 = this.'<>1__state';
    5 if (CS$0$0000 != 0)
    6 {
    7 CS$0$0001 = this.'<>4__this'.GetHere().GetAwaiter();
    8 if (!CS$0$0001.IsCompleted)
    9 {
    10 this.'<>1__state' = 0;
    11 this.'<>u__$awaiter1' = CS$0$0001;
    12 this.'<>t__builder'.AwaitUnsafeOnCompleted(ref CS$0$0001, ref this);
    13 '<>t__doFinallyBodies' = false;
    14 return;
    15 }
    16 }
    17 else
    18 {
    19 CS$0$0001 = this.'<>u__$awaiter1';
    20 this.'<>u__$awaiter1' = CS$0$0002;
    21 this.'<>1__state' = -1;
    22 }
    23
    24
    Console.WriteLine(CS$0$0001.GetResult());
    25 }

    红字是第一次经过的分支,黄底是第二次经过的分支。
    而前面说到的F11进入的区块,实际上就是这里的第24行。
    所以现在可以知道,第二次MoveNext做了什么:
    执行async方法中await后的代码。

    四、水落石出

    async和await的轮廓逐渐清晰了~再结合上一篇的一段代码来看看:

    // 二、理解async
    void MoveNext()
    {
    bool local0;
    Exception local1;

    try
    {
    local0
    = true;
    Thread.Sleep(
    1000);
    Console.WriteLine(
    "HERE");
    }
    catch (Exception e)
    {
    local1
    = e;
    this.'<>1__state' = -2;
    this.'<>t__builder'.SetException(local1);
    return;
    }

    this.'<>1__state' = -2;
    this.'<>t__builder'.SetResult()
    }

    黄底的两句代码原本是在哪的还记得吗?看这里:

    // 二、理解async
    async void SampleMethod()
    {
    Thread.Sleep(
    1000);
    Console.WriteLine(
    "HERE");
    }

    因为这个async方法中没有出现await调用,所以可以认为仅有的两句代码是出现在await操作之前。
    再让SampleMethod变成这样:

    async void SampleMethod()
    {
    Console.WriteLine(
    "WHERE");
    Console.WriteLine(
    await GetHere());
    }

    再看看现在的MoveNext方法:

    1 try
    2 {
    3 '<>t__doFinallyBodies' = true;
    4 CS$0$0000 = this.'<>1__state';
    5 if (CS$0$0000 != 0)
    6 {
    7 Console.WriteLine("WHERE");
    8 CS$0$0001 = this.'<>4__this'.GetHere().GetAwaiter();
    9 if (!CS$0$0001.IsCompleted)
    10 {
    11 this.'<>1__state' = 0;
    12 this.'<>u__$awaiter1' = CS$0$0001;
    13 this.'<>t__builder'.AwaitUnsafeOnCompleted(ref CS$0$0001, ref this);
    14 '<>t__doFinallyBodies' = false;
    15 return;
    16 }
    17 }
    18 else
    19 {
    20 CS$0$0001 = this.'<>u__$awaiter1';
    21 this.'<>u__$awaiter1' = CS$0$0002;
    22 this.'<>1__state' = -1;
    23 }
    24
    25 Console.WriteLine(CS$0$0001.GetResult());
    26 }

    这样就可以很明显的看出来await前后的代码被放到了两个区块里,而这两个区块,也就是之前看到的两次执行MoveNext走过的分支。

    最终调查结果如下:
    1. async方法中的代码会被移交给IAsyncStateMachine的MoveNext方法
    2. async方法中await操作前后的代码被分离
    3. 主线程直接执行await前的代码,并将await的Task移交给线程池ThreadPoolGlobal
    4. 子线程执行完主线程递交来的Task后,再次走入MoveNext方法,执行await后的代码


    最后想说的是:
    这一阵在办公积金销户提取,整个过程就像是个async方法,把申请提交给管理中心(await前操作)以后就得开始等待(await)他们对申请进行审核(执行Task),这个过程加上周末得整整五天,之后还得去管理中心取款(await后操作),总之就是麻烦死了。。。


    本文链接:[C#]async和await刨根问底,转载请注明。



沪ICP备19023445号-2号
友情链接