编解码

首页 标签 编解码
# 编解码 #
关注
17483内容
|
21小时前
|
ViTAR:模糊位置编码让视觉Transformer适配任意分辨率图像
ViTAR代表了视觉Transformer技术的重要进步,特别是在处理多样化和高分辨率图像数据的应用场景中表现出显著优势。
|
21小时前
|
抖音批量发布视频工具,自动上传视频作品笔记,python发布软件
这个抖音批量发布工具包含三个主要模块:主上传程序、配置文件和视频预处理工具。主程序
|
1天前
|
Gemma 3n正式版开源:谷歌全新端侧多模态大模型,2GB 内存就能跑,重点提升编码和推理能力!
6月底,Google正式开源发布了全新端侧多模态大模型 Gemma 3n!相较此前的预览版,最新的 Gemma 3n 完整版进一步提升性能表现,支持在 2GB 内存的硬件上本地运行,重点提升了编码和推理方面的能力。
|
1天前
|
空间转录组学: 测序平台介绍
空间转录组学: 测序平台介绍
详解工业AR眼镜关键技术之光学篇
AR眼镜的光学技术是影响显示效果与佩戴体验的核心,主要包括微显示与光波导技术。微显示决定分辨率、亮度与色彩表现,主流方案有LCOS、Micro-OLED与Micro-LED;光波导则实现轻薄化设计,分为几何波导与衍射波导,分别侧重亮度与厚度控制。未来发展方向为更轻薄、大视场角与低成本。
|
2天前
|
ABoVE:2002-2015 年泛北极和 ABoVE 域区域的开放水域覆盖分数
该数据集提供泛北极及ABoVE区域2002-2015年间的10天合成周期、5公里分辨率的分数开阔水域覆盖图,用于研究高纬度地区水体分布与淹没动态,适用于气候变化对北方-北极生态系统影响的研究。
|
2天前
|
InternVL3开源:7种尺寸覆盖文、图、视频处理,多模态能力扩展至工业图像分析
4月11日,OpenGVLab开源发布InternVL3系列多模态大模型,涵盖1B至78B共7个尺寸。相比InternVL 2.5,其在多模态感知与推理能力上表现更优,并新增工具使用、GUI代理等功能。得益于原生多模态预训练,文本性能超越Qwen2.5系列。
|
3天前
|
ABoVE:1987-2012 年 Landsat 数据得出的 ABoVE 核心域年度扰动因子
简介:该数据集利用Landsat影像,通过缨帽指数变化检测,提供了1987-2012年ABoVE核心区域每年30米分辨率的火灾、昆虫和伐木干扰信息。
免费试用
http://www.vxiaotou.com