课堂教学智慧评价系统基于YOLOX+RNN深度学习算法,课堂教学智慧评价系统通过集成AI大模型,教学过程数据整合形成动态化师生行为画像,结合课堂视频切片与情绪指数热力图,回溯“学生抬头率骤降”“互动冷场”等关键节点,精准把握课堂兴趣点与薄弱环节,形成“数据洞察—视频回溯—策略生成”三阶反思模型,让教学反思落地为可操作的改进策略。督导报告包含个性化改进建议与教师改进轨迹记录,形成可追溯的教学成长档案,让教学督导从单次评估变为长期陪伴。通过人机协同的AI评价技术,实现高度自动化课堂教学质量评价,同时运用多种评价手段、综合多来源评价数据,以教师发展、学生成功为核心动因进行分析评价,实现学校教学质量常态化提升。

YOLOX在YOLO系列的基础上做了一系列的工作,其主要贡献在于:在YOLOv3的基础上,引入了Decoupled Head,Data Aug,Anchor Free和SimOTA样本匹配的方法,构建了一种anchor-free的端到端目标检测框架,并且达到了一流的检测水平。此外,本文提出的 YOLOX-L 模型在视频感知挑战赛(CVPR 2021年自动驾驶研讨会)上获得了第一名。作者还提供了支持ONNX、TensorRT、NCNN和Openvino的部署版本。

目标检测分为Anchor Based和Anchor Free两种方式。

在Yolov3、Yolov4、Yolov5中,通常都是采用 Anchor Based的方式,来提取目标框。

Yolox 将 Anchor free 的方式引入到Yolo系列中,使用anchor free方法有如下好处:

降低了计算量,不涉及IoU计算,另外产生的预测框数量较少。
        假设feature map的尺度为80x80,anchor based方法在Feature Map上,每个单元格一般设置三个不同尺寸大小的锚框,因此产生3x80x80=19200个预测框。而使用anchor free的方法,仅产生80x80=6400个预测框,降低了计算量。

缓解了正负样本不平衡问题
        anchor free方法的预测框只有anchor based方法的1/3,而预测框中大部分是负样本,因此anchor free方法可以减少负样本数,进一步缓解了正负样本不平衡问题。

避免了anchor的调参
        anchor based方法的anchor box的尺度是一个超参数,不同的超参数设置会影响模型性能。anchor free方法避免了这一点。

教室摄像头静默地记录,后台却在上演一场悄无声息的深度学习革命。全新一代课堂教学智慧评价系统以YOLOv12目标检测与RNN时序网络为核心引擎,首次把“实时身体姿态—面部微表情—语音情绪—板书轨迹”四维数据耦合于同一时空坐标系。系统在毫秒级完成学生抬头角度、教师手势指向、互动问答停顿等多粒度标记,并将结果实时投喂给千亿级教育大模型,生成动态、可迭代的师生行为画像。画像不再是静态表格,而是一条随课堂脉搏跳动的“数据生命线”。。由此,系统首创“数据洞察—视频回溯—策略生成”三阶反思模型,让“教学反思”从经验陈述走向算法辅助的精准干预。

 

class Detect(nn.Module):
    stride = None  # strides computed during build
    onnx_dynamic = False  # ONNX export parameter

    def __init__(self, nc=80, anchors=(), ch=(), inplace=True):  # detection layer
        super().__init__()
        self.nc = nc  # number of classes
        self.no = nc + 5  # number of outputs per anchor
        self.nl = len(anchors)  # number of detection layers
        self.na = len(anchors[0]) // 2  # number of anchors
        self.grid = [torch.zeros(1)] * self.nl  # init grid
        self.anchor_grid = [torch.zeros(1)] * self.nl  # init anchor grid
        self.register_buffer('anchors', torch.tensor(anchors).float().view(self.nl, -1, 2))  # shape(nl,na,2)
        self.m = nn.ModuleList(nn.Conv2d(x, self.no * self.na, 1) for x in ch)  # output conv
        self.inplace = inplace  # use in-place ops (e.g. slice assignment)

    def forward(self, x):
        z = []  # inference output
        for i in range(self.nl):
            x[i] = self.m[i](x[i])  # conv
            bs, _, ny, nx = x[i].shape  # x(bs,255,20,20) to x(bs,3,20,20,85)
            x[i] = x[i].view(bs, self.na, self.no, ny, nx).permute(0, 1, 3, 4, 2).contiguous()

            if not self.training:  # inference
                if self.onnx_dynamic or self.grid[i].shape[2:4] != x[i].shape[2:4]:
                    self.grid[i], self.anchor_grid[i] = self._make_grid(nx, ny, i)

                y = x[i].sigmoid()
                if self.inplace:
                    y[..., 0:2] = (y[..., 0:2] * 2 - 0.5 + self.grid[i]) * self.stride[i]  # xy
                    y[..., 2:4] = (y[..., 2:4] * 2) ** 2 * self.anchor_grid[i]  # wh
                else:  # for YOLOv5 on AWS Inferentia https://github.com/ultralytics/yolov5/pull/2953
                    xy = (y[..., 0:2] * 2 - 0.5 + self.grid[i]) * self.stride[i]  # xy
                    wh = (y[..., 2:4] * 2) ** 2 * self.anchor_grid[i]  # wh
                    y = torch.cat((xy, wh, y[..., 4:]), -1)
                z.append(y.view(bs, -1, self.no))

        return x if self.training else (torch.cat(z, 1), x)

    def _make_grid(self, nx=20, ny=20, i=0):
        d = self.anchors[i].device
        if check_version(torch.__version__, '1.10.0'):  # torch>=1.10.0 meshgrid workaround for torch>=0.7 compatibility
            yv, xv = torch.meshgrid([torch.arange(ny).to(d), torch.arange(nx).to(d)], indexing='ij')
        else:
            yv, xv = torch.meshgrid([torch.arange(ny).to(d), torch.arange(nx).to(d)])
        grid = torch.stack((xv, yv), 2).expand((1, self.na, ny, nx, 2)).float()
        anchor_grid = (self.anchors[i].clone() * self.stride[i]) \
            .view((1, self.na, 1, 1, 2)).expand((1, self.na, ny, nx, 2)).float()
        return grid, anchor_grid


课堂教学智慧评价系统为了抵御单一数据源的偏见,课堂教学智慧评价系统采用多模态融合评价框架:除AI视觉与语音分析外,还接入学生匿名弹幕、课后五分钟微问卷、作业错误模式挖掘等多源异构数据。所有数据经联邦学习脱敏后在校园私有云内闭环流转,既保护隐私,又让评价维度更加立体。教师看到的不再是“谁表现不好”,而是“在什么情境下谁需要何种支持”,真正实现以学生成功、教师发展为核心动因的评价范式转型。当技术隐入背景,课堂重新成为生命与生命对话的现场,课堂教学智慧评价系统则像一位无声的助教,持续记录、持续反馈、持续陪伴,让每一次抬头、每一次微笑都被看见,让每一节课都成为教师职业生涯中可复用的成长资产。

Logo

火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。

更多推荐