Sigmastar Comake D1 ssd2355 AIOT开发板 开箱体检分享
Sigmastar Comake PI D1AIOT开发板套件,此文记录一下开箱与使用体验
开发板介绍
了解到星宸科技也开始做开发板了, 他们家的芯片主打性价比,刚好对端侧的AI开发比较感兴趣,在他们商店买了一套Comake PI D1开发板套件,此文记录一下开箱与使用体验!希望能帮助到大家
更多详细的介绍可以去看Comake官网,或者Comake社区的贴子。
1.到手开箱
开箱!可以看到配件,开发板都在箱子里,整个套件的东西还是很多的。


全部拿出来,可以看到包括了:开发板、电源、串口板、亚克力板和螺栓、屏幕、麦克风、扬声器还有组合固定用的亚克力板和螺栓。

接下来把整个套件安装起来。
2.硬件环境搭建
在官方的Sigdoc中,有对板子硬件的说明,可以看到开发板的系统介绍和接口介绍

从客服那边了解到, 安装可以参考官方Comake社区中的配件安装说明 以及相应安装视频
另外这边特别提醒如下:
1.一定要断电状态下安装连接。
2.特别注意屏幕的连线一定要参考官方的配件安装说明,接错或者接反很可能烧坏屏幕。
整个配件安装完就和下图一样

整个套件的内容还是比较多的,全部连接上也比较分散。不过还好官方也提供了亚克力板来固定,参考官方的安装教程,可以把开发板和亚克力板组合起来,把摄像头、屏幕等配件固定上去。全部安装好之后应该是这个样子。

3.软件环境搭建
3.1获取软件资料
Comake D1的相关开发资料,可以到Comake开发者社区去下载。

这里注意,需要注册账号并且完成实名认证,认证通过后方可下载SDK等资料。注册的时候需要提供认证材料。审核是比较宽松也很快的,着急的话可以直接联系客户。
验证通过后就可以下载了。


可以根据需要下载,下载完后的资料包内包括有软硬件资料及说明文档,还有各种工具包。
另外他们还建了官方外网的git server, 下一个SDK大版本发布之前,如果想追新, 买了开发板之后, 也可以联系客户去申请官方git账户,
实时的去下载开发版本的SDK。
3.2开发环境搭建
开发环境通常包括 Linux服务器(用来编译代码)、Windows工作台(用来编写代码)和目标板(用来运行代码),三者处于同一个网络中。这里我在虚拟机上搭建了Ubuntu服务器用来编译代码。具体的步骤不再赘述,可以网上搜索,有很多详细的教程。在官方的Sigdoc 编译环境搭建中也有对应的教程。
如果遇到问题也可以参考Comake社区上的这篇贴子。
4.开始使用
4.1. GUI 的功能体验
开发板在出厂时,默认烧录了带gui界面的32bit image。因此即使上面软件环境搭建一时没有完成,也可以先体验使用一下。配件和亚力克板安装完成后,上电,启动,可以直接启动到gui界面,在屏幕上会显示flythings的gui。

该GUI上面看介绍大概支持如下功能,可玩性还是挺高的:
1.音频播放:演示录音和播放的 Demo
演示不同麦克风输入硬件( AMIC 模拟麦克风,最大支持3通道输入。 DMIC 数字矩阵麦克风,最大支持 e 通道输入)的录音效果,支持不同8K/16R/45K不同的采样率,支持录音音量调节。
2.视频播放:演示视频的播放,目前是固定演示一个片源,支持音量的调节
3.摄像头:演示单路摄像头的画面显示,并对接了 IPU 的物体识别算法,能够实时识别摄像头看到的物体类型和位置,例如人物、显示器、键盘等
4.音频算法播放:
- 人声消除算法演示,算法打开时消除播放声音中的人声,用于歌时,制作不带原唱的背景音乐
- APC 算法演示,演示 ANR (降噪)、 EQ (均衡器处理)、 AGC (自动增益控制)三个算法的集合,这个是音频算法前处理的基本功能
- 环绕音渲染增强,增强空间音效
- 人声关化算法,一般用于 R 歌,为输入的人声增加混响等效果,让声音听起来更好听
5.KMS + ASR :
- KWS 关键词识别, DMIC 收音后,给到 IPU 做关键字匹配,如果识别到了就点亮右下角"你好小星"
- ASR 语音转文字,暂时不支持语义识别
6.TTS :文本转语音, Demo 演示了5段不同的文本语音播放的效果,点击文本位置触发文字转语音播放
7.火山模型: 对接了豆包大模型,支持模型功能的演示
接下来我们来一起看下其中一些功能的效果吧!!
4.1.1. 摄像头显示
滑动GUI到第二页,可以看到摄像头的图标

点击就可以打开。可以看到摄像头的画面输出到屏幕上。并且附带了模型检测,在摄像头前的物体会被识别然后画框。

4.1.2. 火山引擎大模型
在GUI界面第三页,可以看到有火山引擎图标。这个是内置的demo程序,不能直接使用,需要先在火山引擎上配置文件并且载入板端。
具体的操作可以跟着Comake社区的贴子,一步一步操作。这里不赘述了。

在全部配置完成后,启动。屏幕会切换到摄像头画面

同时,扬声器会播放语音“你好,我是小星”的欢迎词。如果你说“你好小星”,那么也会有相应的语句回应。这里我们插上串口板,可以看见大模型的数据发送。


4.2. AI实战Demo功能体验
另外建议把把串口也连上,串口的连接同样可以参考Comake开发者社区的这篇贴子。 连上串口之后,除了
上述GUI功能, 该开发板还提供了大量的demo程序,比如 /customer/opendla 提供了大量的AI 算法demo ,具体介绍可以参考 IPU Sigdoc 开源算法demo
实战的介绍
/customer/opendla # ls
models prog_sed_eat
prog_asr_conformer prog_segmentation_yolov8
prog_benchmark prog_separation_sepformer
prog_classification prog_speaker
prog_detection_yolov11_obb prog_tts_fastspeech2
prog_detection_yolov5 prog_tts_vits
prog_detection_yolov8 prog_vad_nemo
prog_llm_conformer_punc prog_vlm_clip
prog_llm_transformerlm prog_vlm_mobilesam
prog_ocr_lpr prog_vlm_tag2text
prog_ocr_ppocr prog_vlm_yolo_world
prog_pose_yolov8 resource
我这里跑了一下yolov8 算法的效果:
1.串口输入如下cmd
cd /customer/opendla
./prog_detection_yolov8 -i ./resource/bus.jpg -m ./models/dectection/yolov8n_640x640.img
2.输出结果如下:


4.3. 其他功能Demo的体验
在/customer/sample code 也放了海量demo,具体每个demo的用法可以参考SDK内部对应source code目录下的readme.md .感兴趣的小伙伴可以进一步的去研究。
/customer/sample_code # ls -x
audio_ai_ao_demo
audio_alg_2mic_bf_ssl_demo
audio_alg_4mic_bf_ssl_demo
audio_alg_aec_demo
audio_alg_apc_demo
audio_alg_kws_demo
audio_alg_mix_demo
audio_alg_sed_demo
audio_alg_vad_demo
audio_mp3_play_demo
bootlogo_mem_free
crypto_aes_demo
crypto_rsa_demo
crypto_sha_demo
disp_panel_demo
disp_pspi_demo
disp_sensor2Panel_demo
dla_detection_demo
dla_ipu_utilization
double_sensor_transfer_double_sensor_openh264_transfer_demo
double_sensor_transfer_double_sensor_transfer_demo
gfx_gfx_demo
intercoremgr
ive_sample_16bit_to_8bit
ive_sample_acc
ive_sample_add
ive_sample_adp_thresh
ive_sample_alpha_blending
.....等
5.总结
- comake PI D1的套件内容非常齐全,在视频相关、音频相关、AI相关的开发上有丰富的硬件资源和软件资料。
同时Sigdoc和Comake开发者论坛都有内容丰富易上手的开发指导资料,也可以在Comake开发者论坛上直接提问。
2.买了开发板还可以进入vip 群,有什么问题都可以及时的交流,原厂直接支持
总的来说,Comake PI D1在智慧视觉、智慧音频、智能机器人、小屏显示、工业HML PLC等应用的音视频处理+AI方向上有非常不错的使用体验和使用前景。
火山引擎开发者社区是火山引擎打造的AI技术生态平台,聚焦Agent与大模型开发,提供豆包系列模型(图像/视频/视觉)、智能分析与会话工具,并配套评测集、动手实验室及行业案例库。社区通过技术沙龙、挑战赛等活动促进开发者成长,新用户可领50万Tokens权益,助力构建智能应用。
更多推荐
所有评论(0)