软实时系统介绍¶
本章主要介绍openEuler Embedded软实时系统的特性说明,构建方式和性能测试。
软实时特性介绍¶
实时性简介
实时的诉求通常是事件的响应时间不能超过规定的期限,一个事件的最大响应时间应该是确定的、可以预测的。
PREEMPT_RT补丁简介
PREEMPT_RT补丁(以下简称RT补丁)可直接打在内核源码上,并通过内核配置选项 CONFIG_PREEMPT_RT=y 使能软实时功能。RT补丁实现的核心在于最小化内核中不可抢占部分的代码,从而使高优先级任务就绪时能及时抢占低优先级任务,减少切换时延。除此之外,补丁通过多种降低时延的措施,对锁、驱动等模块也进行了优化。
补丁关键功能举例
增加中断程序的可抢占性(中断线程化、软中断线程化)
增加临界区的可抢占性(如自旋锁)
增加关中断代码的可抢占性
解决优先级反转问题(优先级继承)
软实时镜像构建指导¶
根据 oebuild快速构建 ,初始化oebuild工作目录;
oebuild init <directory> cd <directory> oebuild update
进入oebuild工作目录,创建对应的编译配置文件,软实时镜像需要添加
-f openeuler-rt
:# arm64 oebuild generate -p aarch64-std -f openeuler-rt -d <build_arm64_rt> # RPI4 oebuild generate -p raspberrypi4-64 -f openeuler-rt -d <build_rpi_rt> # x86 oebuild generate -p x86-64-std -f openeuler-rt -d <build_x86_rt>
进入
<build>
目录,编译openeuler-image:oebuild bitbake openeuler-image
Note
openEuler Embedded 软实时特性当前不支持 arm32 架构
验证软实时是否使能¶
使能软实时特性后,系统会带有
PREEMPT_RT
字样,可以通过以下命令进行判断:$ uname -a Linux openeuler 5.10.0-rt62-v8 #1 SMP PREEMPT_RT Fri Mar 25 03:58:22 UTC 2022 aarch64 GNU/Linux
软实时性能测试¶
软实时相关测试
- 参考 RT-Tests 指导 进行软实时相关测试,用例包括但不限于:
cyclictest 时延性能测试
pi_stress 优先级继承测试
hackbench 负载构造工具
下面以cyclictest 时延性能测试为例进行说明。
cyclictest 时延性能测试
Note
对于x86架构:cyclictest工具依赖libnuma.so
,而SDK中未提供该库,建议使用openEuler-Embedded构建容器(或其它x86环境)编译cyclictest,并将libnuma.so上传到环境的/lib64/
目录。对于arm64架构:可以参考下述步骤,使用SDK进行交叉编译。
准备开发环境
参考 安装SDK
sh openeuler-glibc-x86_64-openeuler-image-aarch64-qemu-aarch64-toolchain-22.03.sh . /path/to/sdk/environment-setup-aarch64-openeuler-linux编译用例
git clone https://git.kernel.org/pub/scm/utils/rt-tests/rt-tests.git cd rt-tests git checkout stable/v1.0 make all执行用例
编译完成后生成二进制
cyclictest
,传入单板环境后可查看执行cyclictest时可配置的参数:./cyclictest --help
cyclictest有多种参数配置方法,用例具体的入参设计可参考:test-design
输入示例:
./cyclictest -p 90 -m -i 100 -n -h 100 -l 10000000
输出示例:
# /dev/cpu_dma_latency set to 0us policy: fifo: loadavg: 2.32 1.99 1.58 1/95 311 T: 0 ( 311) P:90 I:100 C:10000000 Min: 7 Act: 9 Avg: 8 Max: 16即用例循环1000万次后,平均时延为8us,最坏时延为16us(该数据仅为示例,具体以环境实测为准)。
Attention
如果树莓派4B的空载情况下,平均时延较差(如超过20us),可查看使用的树莓派固件是否将CPU频率配置为了节能模式,并根据需要将CPU频率配置为最高运行频率。如无cpufreq相关接口,则不涉及。
输入示例:
cat /sys/devices/system/cpu/cpu*/cpufreq/scaling_governor
输出示例:
powersave
如上结果表示CPU频率为节能模式。
配置CPU最高运行频率,输入示例:
echo performance > /sys/devices/system/cpu/cpu*/cpufreq/scaling_governor
软实时性能优化¶
性能优化的原则是:降低不确定性,提高可预期性。实时性能的优化是非常复杂的,涉及硬件底层架构特征、内核采用的机制策略,以及上层软件的编程设计等。以下介绍了x86平台的一些性能优化措施:
调整BIOS配置: 关闭
Hyper-Threading
,Intel SpeendStep
.添加内核启动参数:
Kernel Command Line
Description
intel_pstate=disable
禁用intel调频
nohalt idle=poll intel_idle.max_cstate=0 processor.max_cstate=1
避免CPU陷入深层次的省电睡眠状态
nowatchdog
关闭softlockup和hardlockup
mce=ignore_ce
忽略mce
clocksource=tsc tsc=reliable
指定tsc作为系统clocksource
修改虚拟内存统计周期:
sysctl -w vm.stat_interval=120
除了上述的针对系统全局的配置修改外,还可以为某些核进行单独配置:
Kernel Command Line
Description
isolcpus=<cpu number>,…,<cpu number>
避免普通任务在指定CPU上调度运行
nohz_full=<cpu number>,…,<cpu number>
关闭指定CPU的tick
rcu_nocbs=<cpu number>,…,<cpu number>
卸载指定CPU的RCU回调任务
irqaffinity=<cpu number>,…,<cpu number>
配置中断亲缘性,默认由指定核处理中断
可以为某些核进行以上配置,再将实时任务进行绑核,以减少实时任务受到的干扰。例如:
Step1: # 修改cmdline以隔离出cpu2及cpu3: "isolcpus=2,3 nohz_full=2,3 rcu_nocbs=2,3 irqaffinity=0,1" Step 2: # 将实时任务绑定到2核或3核 taskset -c 2 ./realtime_task1 taskset -c 3 ./realtime_task2
Note
openEuler-Embedded 可以通过修改boot分区的
grub.cfg
配置内核启动参数,例如:vi /run/media/sda1/efi/boot/grub.cfg # cmdline 为 "rw quiet" menuentry 'boot'{ linux /bzImage root=PARTUUID=eaecae14-7021-4551-9183-29b0d210222f rw quiet }