Chinaunix
标题:
freebsd9.2-何时调用mini_switch函数-线程时间片用完
[打印本页]
作者:
71v5
时间:
2014-06-24 21:08
标题:
freebsd9.2-何时调用mini_switch函数-线程时间片用完
本帖最后由 71v5 于 2014-06-25 21:46 编辑
当statclock超时时,就会调用statclock_cnt进行相应的处理:
/**************************************************************************
* Statistics clock. Updates rusage information and calls the scheduler
* to adjust priorities of the active thread.
*
* This should be called by all active processors.
参数描述:
cnt:statclock超时的次数。
usermode:发生APIC TIMER中断时cpu是否处于用户态。
***********************************/
708 void
709 statclock_cnt(int cnt, int usermode)
710 {
711 struct rusage *ru;
712 struct vmspace *vm;
713 struct thread *td;
714 struct proc *p;
715 long rss;
716 long *cp_time;
717
718 td = curthread;
719 p = td->td_proc;
720
/***********************************************************************************************************
* struct pcpu数据对象的pc_cp_time成员定义如下:
long pc_cp_time[CPUSTATES]; /* statclock ticks */
数组pc_cp_time的索引可以取值如下:
#define CP_USER 0
#define CP_NICE 1
#define CP_SYS 2
#define CP_INTR 3
#define CP_IDLE 4
#define CPUSTATES 5
#define NZERO 0 /* default "nice" */
signed char p_nice; /* (c) Process "nice" value. */
通过722-756之间代码,可以看出什么条件下递增struct thread对象的下列成员,这些成员
都是对statclock超时次数进行计数:
td_pticks:APIC TIMER中断发生时线程运行在内核态,并且线程不是中断线程或者线程的
中断嵌套小于2,此时递增td_pticks。
u_int td_pticks; /* (t) Statclock hits for profiling */
td_sticks:同td_pticks
u_int td_sticks; /* (t) Statclock hits in system mode. */
td_iticks:APIC TIMER中断发生时线程运行在内核态,并且线程是中断线程或者线程的
中断嵌套大于2,此时递增td_iticks。
u_int td_iticks; /* (t) Statclock hits in intr mode. */
td_uticks:APIC TIMER中断发生时线程运行在用户态,此时递增td_uticks。
u_int td_uticks; /* (t) Statclock hits in user mode. */
pc_cp_time数组元素也是对statclock的超时次数进行计数,只不过使用另外一种方式
来描述,含义是显而易见的。
722-731:cpu处于用户态。
731-756:cpu处于内核态。
************************************************************************************************/
721 cp_time = (long *)PCPU_PTR(cp_time);
722 if (usermode) {
723 /*
724 * Charge the time as appropriate.
725 */
726 td->td_uticks += cnt;
727 if (p->p_nice > NZERO)
728 cp_time[CP_NICE] += cnt;
729 else
730 cp_time[CP_USER] += cnt;
731 } else {
732 /*
733 * Came from kernel mode, so we were:
734 * - handling an interrupt,
735 * - doing syscall or trap work on behalf of the current
736 * user process, or
737 * - spinning in the idle loop.
738 * Whichever it is, charge the time as appropriate.
739 * Note that we charge interrupts to the current process,
740 * regardless of whether they are ``for'' that process,
741 * so that we know how much of its real time was spent
742 * in ``non-process'' (i.e., interrupt) work.
743 */
744 if ((td->td_pflags & TDP_ITHREAD) ||
745 td->td_intr_nesting_level >= 2) {
746 td->td_iticks += cnt;
747 cp_time[CP_INTR] += cnt;
748 } else {
749 td->td_pticks += cnt;
750 td->td_sticks += cnt;
751 if (!TD_IS_IDLETHREAD(td))
752 cp_time[CP_SYS] += cnt;
753 else
754 cp_time[CP_IDLE] += cnt;
755 }
756 }
757
758
/*********************************************************
* Update resource usage integrals and maximums.
760-767:进程资源使用量相关处理,暂时略过。
********************************/
759 MPASS(p->p_vmspace != NULL);
760 vm = p->p_vmspace;
761 ru = &td->td_ru;
762 ru->ru_ixrss += pgtok(vm->vm_tsize) * cnt;
763 ru->ru_idrss += pgtok(vm->vm_dsize) * cnt;
764 ru->ru_isrss += pgtok(vm->vm_ssize) * cnt;
765 rss = pgtok(vmspace_resident_count(vm));
766 if (ru->ru_maxrss < rss)
767 ru->ru_maxrss = rss;
768 KTR_POINT2(KTR_SCHED, "thread", sched_tdname(td), "statclock",
769 "prio:%d", td->td_priority, "stathz:%d", (stathz)?stathz:hz);
770 SDT_PROBE2(sched, , , tick, td, td->td_proc);
771 thread_lock_flags(td, MTX_QUIET);
/******************************************************
* 772-773: 重点
调度程序相关的sched_clock函数。
**************************/
772 for ( ; cnt > 0; cnt--)
773 sched_clock(td);
774 thread_unlock(td);
775 #ifdef HWPMC_HOOKS
776 if (td->td_intr_frame != NULL)
777 PMC_SOFT_CALL_TF( , , clock, stat, td->td_intr_frame);
778 #endif
779 }
复制代码
[ULE调度程序的sched_clock函数]:
2174 /*
2175 * Handle a stathz tick. This is really only relevant for timeshare
2176 * threads.
2177 */
2178 void
2179 sched_clock(struct thread *td)
2180 {
2181 struct tdq *tdq;
2182 struct td_sched *ts;
2183 /* 2185:tdq指向当前cpu对应的struct tdq对象 */
2184 THREAD_LOCK_ASSERT(td, MA_OWNED);
2185 tdq = TDQ_SELF();
2186 #ifdef SMP
2187
2188
/**********************************************************************************************
* We run the long term load balancer infrequently on the first cpu.
static struct tdq *balance_tdq;
static int balance_ticks;
2190-2193:
在ULE调度程序初始化阶段,BSP会将balance_tdq设置为BSP对应的struct tdq
数据对象的地址。
balance_ticks为调用sched_balance函数在系统中cpu的运行队列间迁移线程
的周期,在ULE调度程序初始化阶段设置,具体值是多少应该没什么意义:
balance_interval默认值为128.
balance_ticks = max(balance_interval / 2, 1);
balance_ticks += random() % balance_interval;
当balance_ticks为零0时,函数sched_balance就要保持系统中cpu运行队列
间的平衡。
*******************************************/
2189
2190 if (balance_tdq == tdq) {
2191 if (balance_ticks && --balance_ticks == 0)
2192 sched_balance();
2193 }
2194 #endif
2195 /*
2196 * Save the old switch count so we have a record of the last ticks
2197 * activity. Initialize the new switch count based on our load.
2198 * If there is some activity seed it to reflect that.
2199 */
2200 tdq->tdq_oldswitchcnt = tdq->tdq_switchcnt;
2201 tdq->tdq_switchcnt = tdq->tdq_load;
/**************************************************************************
* Advance the insert index once for each tick to ensure that all
* threads get a chance to run.
2206-2210:防止时间片轮转的线程发生饿死现象。
*************************/
2205 */
2206 if (tdq->tdq_idx == tdq->tdq_ridx) {
2207 tdq->tdq_idx = (tdq->tdq_idx + 1) % RQ_NQS;
2208 if (TAILQ_EMPTY(&tdq->tdq_timeshare.rq_queues[tdq->tdq_ridx]))
2209 tdq->tdq_ridx = tdq->tdq_idx;
2210 }
/*****************************************************************
* 2211:ts指向和td相关联的struct td_sched数据对象。
2212:函数sched_pctcpu_updat更新struct td_sched数据对象中的
相关成员。
*********************************/
2211 ts = td->td_sched;
2212 sched_pctcpu_update(ts, 1);
/******************************************************
* #define PRI_FIFO_BIT 8
如果线程td的调度类为PRI_FIFO_BIT,这里就直接返回。
*****************************/
2213 if (td->td_pri_class & PRI_FIFO_BIT)
2214 return;
/**********************************************************************
* 2215-2223:
#define PRI_TIMESHARE 3 Time sharing process.
如果线程td的调度类为时间片轮转,此时就要进行相应的处理:
2220:给线程运行时间增加一个tickincr,ULE调度程序源码中
对该变量的描述如下:
tickincr:Converts a stathz tick into a hz domain scaled by
the shift factor. Without the shift the error rate
due to rounding would be unacceptably high.
2221:sched_interact_update函数调整td的睡眠时间和运行时间。
2222:sched_priority函数调整struct thread对象的td_user_pri,
td_base_user_pri两个成员。
*********************************************/
2215 if (PRI_BASE(td->td_pri_class) == PRI_TIMESHARE) {
2216 /*
2217 * We used a tick; charge it to the thread so
2218 * that we can compute our interactivity.
2219 */
2220 td->td_sched->ts_runtime += tickincr;
2221 sched_interact_update(td);
2222 sched_priority(td);
2223 }
2224
/************************************************************************
* Force a context switch if the current thread has used up a full
* time slice (default is 100ms).
#define TDF_NEEDRESCHED 0x00010000 Thread needs to yield.
#define TDF_SLICEEND TDF_SCHED2 Thread time slice is over.
sched_slice:
ULE调度程序源码中对该变量的描述为:Runtime of each thread before
rescheduling,默认值为12,可见sched_slice为每个线程的时间片,
因为statclock的周期为1/128秒,在使用默认时间片的情况下,一个线程
用完其时间片的大概时间为(1/128) * 12,这个结果为0.09秒,约为0.1秒,
即100毫秒。
2229-2231:
如果线程td不是idle线程,并且线程td的时间片用完,此时:
2230:重新设置线程td的时间片。
2231:给线程td设置TDF_NEEDRESCHED和TDF_SLICEEND标志。
在中断返回时,会检查线程td是否设置了TDF_NEEDRESCHED标志,
如果设置,就调用mini_switch函数。
*******************************/
2229 if (!TD_IS_IDLETHREAD(td) && --ts->ts_slice <= 0) {
2230 ts->ts_slice = sched_slice;
2231 td->td_flags |= TDF_NEEDRESCHED | TDF_SLICEEND;
2232 }
2233 }
复制代码
欢迎光临 Chinaunix (http://bbs.chinaunix.net/)
Powered by Discuz! X3.2