内容
活动
关注

CreatePartition API执行流程_milvus源码解析

简介: CreatePartition API执行流程_milvus源码解析

CreatePartition API执行流程源码解析

milvus版本:v2.3.2

整体架构:

architecture.png

CreatePartition 的数据流向:

create_partition数据流向.jpg

1.客户端sdk发出CreatePartition API请求。

from pymilvus import ( connections, Collection, Partition, ) print("start connecting to Milvus") connections.connect(db_name="default", host="192.168.230.71", port="19530") hello_milvus = Collection("hello_milvus") print("create a partition") partition = Partition(hello_milvus, name="part01", description="this is a partition") 

客户端SDK向proxy发送一个CreatePartition API请求,在hello_milvus这个collection下创建一个名为part01的partition。

exam_partition.jpg

2.客户端接受API请求,将request封装为createPartitionTask,并压入ddQueue队列。

代码路径:internal\proxy\impl.go

// CreatePartition create a partition in specific collection. func (node *Proxy) CreatePartition(ctx context.Context, request *milvuspb.CreatePartitionRequest) (*commonpb.Status, error) {  ...... // request封装为task cpt := &createPartitionTask{  ctx: ctx, Condition: NewTaskCondition(ctx), CreatePartitionRequest: request, rootCoord: node.rootCoord, result: nil, } ...... // 将task压入ddQueue队列 if err := node.sched.ddQueue.Enqueue(cpt); err != nil {  ...... } ...... // 等待cct执行完 if err := cpt.WaitToFinish(); err != nil {  ...... } ...... } 

3.执行createPartitionTask的3个方法PreExecute、Execute、PostExecute。

PreExecute()一般为参数校验等工作。

Execute()一般为真正执行逻辑。

代码路径:internal\proxy\task.go

func (t *createPartitionTask) Execute(ctx context.Context) (err error) {  t.result, err = t.rootCoord.CreatePartition(ctx, t.CreatePartitionRequest) if err != nil {  return err } if t.result.ErrorCode != commonpb.ErrorCode_Success {  return errors.New(t.result.Reason) } return err } 

从代码可以看出调用了rootCoord的CreatePartition接口。

4.进入rootCoord的CreatePartition接口。

代码路径:internal\rootcoord\root_coord.go

继续将请求封装为rootcoord里的createDatabaseTask

// CreatePartition create partition func (c *Core) CreatePartition(ctx context.Context, in *milvuspb.CreatePartitionRequest) (*commonpb.Status, error) {  ...... // 封装为createPartitionTask t := &createPartitionTask{  baseTask: newBaseTask(ctx, c), Req: in, } // 加入调度 if err := c.scheduler.AddTask(t); err != nil {  ...... } // 等待task完成 if err := t.WaitToFinish(); err != nil {  ...... } ...... } 

5.执行createPartitionTask的Prepare、Execute、NotifyDone方法。

Execute()为核心方法。

代码路径:internal\rootcoord\create_partition_task.go

func (t *createPartitionTask) Execute(ctx context.Context) error {  for _, partition := range t.collMeta.Partitions {  if partition.PartitionName == t.Req.GetPartitionName() {  log.Warn("add duplicate partition", zap.String("collection", t.Req.GetCollectionName()), zap.String("partition", t.Req.GetPartitionName()), zap.Uint64("ts", t.GetTs())) return nil } } cfgMaxPartitionNum := Params.RootCoordCfg.MaxPartitionNum.GetAsInt() if len(t.collMeta.Partitions) >= cfgMaxPartitionNum {  return fmt.Errorf("partition number (%d) exceeds max configuration (%d), collection: %s", len(t.collMeta.Partitions), cfgMaxPartitionNum, t.collMeta.Name) } // 分配partID partID, err := t.core.idAllocator.AllocOne() if err != nil {  return err } // 构建partition结构体 // 包含partID,partName,collectID等 partition := &model.Partition{  PartitionID: partID, PartitionName: t.Req.GetPartitionName(), PartitionCreatedTimestamp: t.GetTs(), Extra: nil, CollectionID: t.collMeta.CollectionID, State: pb.PartitionState_PartitionCreating, } undoTask := newBaseUndoTask(t.core.stepExecutor) // 分为多个step执行,每一个undoTask由todoStep和undoStep构成 // 执行todoStep,报错则执行undoStep undoTask.AddStep(&expireCacheStep{  baseStep: baseStep{ core: t.core}, dbName: t.Req.GetDbName(), collectionNames: []string{ t.collMeta.Name}, collectionID: t.collMeta.CollectionID, ts: t.GetTs(), }, &nullStep{ }) // 添加partition元数据 undoTask.AddStep(&addPartitionMetaStep{  baseStep: baseStep{ core: t.core}, partition: partition, }, &removePartitionMetaStep{  baseStep: baseStep{ core: t.core}, dbID: t.collMeta.DBID, collectionID: partition.CollectionID, partitionID: partition.PartitionID, ts: t.GetTs(), }) undoTask.AddStep(&nullStep{ }, &releasePartitionsStep{  baseStep: baseStep{ core: t.core}, collectionID: t.collMeta.CollectionID, partitionIDs: []int64{ partID}, }) undoTask.AddStep(&syncNewCreatedPartitionStep{  baseStep: baseStep{ core: t.core}, collectionID: t.collMeta.CollectionID, partitionID: partID, }, &nullStep{ }) undoTask.AddStep(&changePartitionStateStep{  baseStep: baseStep{ core: t.core}, collectionID: t.collMeta.CollectionID, partitionID: partID, state: pb.PartitionState_PartitionCreated, ts: t.GetTs(), }, &nullStep{ }) return undoTask.Execute(ctx) } 

创建partition涉及多个步骤,可以看出这里依次分为expireCacheStep、addPartitionMetaStep、syncNewCreatedPartitionStep、changePartitionStateStep这几个步骤,关于etcd元数据的操作,这里重点关注addPartitionMetaStep。其余step另用篇幅进行讲解。

6.进入addCollectionMetaStep,执行其Execute()方法。

代码路径:internal\rootcoord\step.go

func (s *addPartitionMetaStep) Execute(ctx context.Context) ([]nestedStep, error) {  err := s.core.meta.AddPartition(ctx, s.partition) return nil, err } 

在这里重点研究s.core.meta.AddPartition()这个方法做了什么事情。

调用栈如下:

s.core.meta.AddPartition() |--AddPartition()(internal\rootcoord\meta_table.go) |--mt.catalog.CreatePartition()(同上) |--CreatePartition()(internal\metastore\kv\rootcoord\kv_catalog.go) |--kc.Snapshot.Save() 

create_partition堆栈.jpg

在etcd产生partition相关的key:

==root-coord/partitions/445762854989594797/445766775506484222==

value的值的结构为etcdpb.PartitionInfo,然后进行protobuf序列化后存入etcd。

因此etcd存储的是二进制数据。

&pb.PartitionInfo{  PartitionID: partition.PartitionID, PartitionName: partition.PartitionName, PartitionCreatedTimestamp: partition.PartitionCreatedTimestamp, CollectionId: partition.CollectionID, State: partition.State, } 

partitionInfo2.jpg

可以看出partition由partitionID、partitionName、collectionID等组成。

func (kc *Catalog) CreatePartition(ctx context.Context, dbID int64, partition *model.Partition, ts typeutil.Timestamp) error {  collMeta, err := kc.loadCollection(ctx, dbID, partition.CollectionID, ts) if err != nil {  return err } if partitionVersionAfter210(collMeta) {  // save to newly path. // 走这条路径 // 构建key的规则 k := BuildPartitionKey(partition.CollectionID, partition.PartitionID) partitionInfo := model.MarshalPartitionModel(partition) // 序列化 v, err := proto.Marshal(partitionInfo) if err != nil {  return err } // 写入etcd return kc.Snapshot.Save(k, string(v), ts) } ...... } 

跟踪BuildPartitionKey()函数,不难得出key的规则。整理如下:

key规则:

  • 前缀/root-coord/partitions/{collectionID}/{partitionID}
  • 前缀/snapshots/root-coord/partitions/{collectionID}/{partitionID}_ts{时间戳}

根据路径能够反映出partition属于哪个collection。一个collection可以包含多个partition。

默认partition名为:_default。

可配置(milvus.yml):common.defaultPartitionName

使用etcd-manager查看etcd:

partition.jpg

总结:

1.CreatePartition由proxy传递给协调器rootCoord操作etcd。

2.CreatePartition最终会在etcd上写入一种类型的key

  • 前缀/root-coord/partitions/{collectionID}/{partitionID}
  • 前缀/snapshots/root-coord/partitions/{collectionID}/{partitionID}_ts{时间戳}
目录
相关文章
|
1月前
|
API 开发者 数据采集
高效获取淘宝商品详情:API 开发实现链接解析的完整技术方案
2025反向海淘新机遇:依托代购系统,聚焦小众垂直品类,结合Pandabay数据选品,降本增效。系统实现智能翻译、支付风控、物流优化,助力中式养生茶等品类利润翻倍,新手也能快速入局全球市场。
高效获取淘宝商品详情:API 开发实现链接解析的完整技术方案
|
30天前
|
存储 缓存 算法
淘宝买家秀 API 深度开发:多模态内容解析与合规推荐技术拆解
本文详解淘宝买家秀接口(taobao.reviews.get)的合规调用、数据标准化与智能推荐全链路方案。涵盖权限申请、多模态数据清洗、情感分析、混合推荐模型及缓存优化,助力开发者提升审核效率60%、商品转化率增长28%,实现UGC数据高效变现。
|
1月前
|
XML 数据采集 API
用Lxml高效解析XML格式数据:以天气API为例
免费Python教程:实战解析中国天气网XML数据,详解Lxml库高效解析技巧、XPath用法、流式处理大文件及IP封禁应对策略,助你构建稳定数据采集系统。
153 0
|
监控 Java 应用服务中间件
高级java面试---spring.factories文件的解析源码API机制
【11月更文挑战第20天】Spring Boot是一个用于快速构建基于Spring框架的应用程序的开源框架。它通过自动配置、起步依赖和内嵌服务器等特性,极大地简化了Spring应用的开发和部署过程。本文将深入探讨Spring Boot的背景历史、业务场景、功能点以及底层原理,并通过Java代码手写模拟Spring Boot的启动过程,特别是spring.factories文件的解析源码API机制。
331 2
|
8月前
|
算法 测试技术 C语言
深入理解HTTP/2:nghttp2库源码解析及客户端实现示例
通过解析nghttp2库的源码和实现一个简单的HTTP/2客户端示例,本文详细介绍了HTTP/2的关键特性和nghttp2的核心实现。了解这些内容可以帮助开发者更好地理解HTTP/2协议,提高Web应用的性能和用户体验。对于实际开发中的应用,可以根据需要进一步优化和扩展代码,以满足具体需求。
794 29
|
8月前
|
前端开发 数据安全/隐私保护 CDN
二次元聚合短视频解析去水印系统源码
二次元聚合短视频解析去水印系统源码
306 4
|
8月前
|
JavaScript 算法 前端开发
JS数组操作方法全景图,全网最全构建完整知识网络!js数组操作方法全集(实现筛选转换、随机排序洗牌算法、复杂数据处理统计等情景详解,附大量源码和易错点解析)
这些方法提供了对数组的全面操作,包括搜索、遍历、转换和聚合等。通过分为原地操作方法、非原地操作方法和其他方法便于您理解和记忆,并熟悉他们各自的使用方法与使用范围。详细的案例与进阶使用,方便您理解数组操作的底层原理。链式调用的几个案例,让您玩转数组操作。 只有锻炼思维才能可持续地解决问题,只有思维才是真正值得学习和分享的核心要素。如果这篇博客能给您带来一点帮助,麻烦您点个赞支持一下,还可以收藏起来以备不时之需,有疑问和错误欢迎在评论区指出~
|
8月前
|
移动开发 前端开发 JavaScript
从入门到精通:H5游戏源码开发技术全解析与未来趋势洞察
H5游戏凭借其跨平台、易传播和开发成本低的优势,近年来发展迅猛。接下来,让我们深入了解 H5 游戏源码开发的技术教程以及未来的发展趋势。
|
8月前
|
存储 前端开发 JavaScript
在线教育网课系统源码开发指南:功能设计与技术实现深度解析
在线教育网课系统是近年来发展迅猛的教育形式的核心载体,具备用户管理、课程管理、教学互动、学习评估等功能。本文从功能和技术两方面解析其源码开发,涵盖前端(HTML5、CSS3、JavaScript等)、后端(Java、Python等)、流媒体及云计算技术,并强调安全性、稳定性和用户体验的重要性。

推荐镜像

查看更多
  • DNS
  • 下一篇