2026/4/16 14:49:12
网站建设
项目流程
建网站数据库,开封市建设中专网站,广州市番禺区官网,icp ip 网站备案查询系统Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境#xff0c;以高效编写自定义 DNN 计算内核#xff0c;并能够在现代 GPU 硬件上以最大吞吐量运行。
更多 Triton 中文文档可访问 →triton.hyper.ai/
triton.language.store(pointer, value…Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境以高效编写自定义 DNN 计算内核并能够在现代 GPU 硬件上以最大吞吐量运行。更多 Triton 中文文档可访问 →triton.hyper.ai/triton.language.store(pointer, value, maskNone, boundary_check(), cache_modifier, eviction_policy)将数据张量存储到由指针定义的内存位置。1.如果pointer是单元素指针则加载 1 个标量。在这种情况下mask必须是标量boundary_check和padding_option必须为空。2.如果pointer是 1 个 N 维指针张量则会存储 1 个 N 维张量。在这种情况下mask会被隐式地广播到pointer.shapeboundary_check必须为空。3.如果pointer是由make_block_ptr定义的块指针则会存储 1 个张量。在这种情况下mask必须为None可以指定boundary_check以控制越界访问的行为。value会被隐式地广播为pointer.shape并转换为pointer.element_ty类型。参数****pointer(triton.PointerType, 或 dtypetriton.PointerType 的块) - 存储 value 元素的内存位置。value(Block) - 要存储的元素张量。masktriton.int1 的块,可选- 如果 mask[idx] 为 false则不将 value[idx] 存储在 pointer[idx] 处。boundary_check整数元组,可选- 整数元组表示应该进行边界检查的维度。cache_modifier(str可选应为 {“”空字符串、“.wb”表示缓存回写所有一致性层级、“.cg”表示全局缓存、“.cs”表示缓存流、“.wt”表示缓存直写} 中的一个更多详情请参见缓存操作符—— 在 NVIDIA PTX 中更改缓存选项。eviction_policystr可选应为 {“”, “evict_first”, “evict_last”} 中的一个- 更改 NVIDIA PTX 中的驱逐策略。这个函数也可作为tensor的成员函数调用使用x.store(...)方式而不是store(x, ...)。