当前位置:首页 > 后端开发 > kafka文件存储机制

kafka文件存储机制

7个月前 (05-20)51

前言

我们知道,生产者发送给kafka的数据肯定是需要存储的,存储意味着数据落盘,但是这个数据存储的结构是怎样的呢?

不妨先来了解下kafka文件存储机制

  • Topic是逻辑上的概念,而partition是物理上的概念,每个partition对应于一个log文件,该log文件中存储的就是Producer生产的数据;
  • Producer生产的数据会被不断追加到该log文件末端,为防止log文件过大导致数据定位效率低下,Kafka采取了分片和索引机制,将每个partition分为多个segment;
  • 每个segment包括:“.index”文件、“.log”文件和.timeindex等文件。这些文件位于一个文件夹下,该文件夹的命名规则为:topic名称+分区序号,例如:first-0;

总体的文件结构如下图所示:

kafka文件存储机制 _ Java侠

对上面的文件结构再做几点补充说明:

  • 一个partition分为多个segment
  • .log 日志文件  .index 偏移量

作者:逆风飞翔的小叔
来源链接:https://blog.csdn.net/congge_study/article/details/123310936

标签: Kafka

“kafka文件存储机制” 的相关文章

m1安装Kafka(使用Confluent)

m1安装Kafka(使用Confluent)

brew安装kafka不好使,只能自己找找方法了! 以下亲测可行,超级详细: 下载confluent,https://www.confl...

史上最详细Kafka原理总结 | 建议收藏

史上最详细Kafka原理总结 | 建议收藏

Kafka Kafka是最初由Linkedin公司开发,是一个分布式、支持分区的(partition)、多副本的(replica),基于zooke...

kafka基本原理概述——patition与replication分配

kafka基本原理概述——patition与replication分配

    kafka一直在大数据中承受着数据的压力也扮演着对数据维护转换的角色,下面重点介绍kafka大致组成及其partition副本的分配原则:...

kafka的编译和使用

kafka的编译和使用

一.kafka的使用 kafka官网提供了编译好的二进制包,下载即用 http://kafka.apache.org/downloads。最新版本的是1.1.0...

解决Kafka消费端错误:o.s.kafka.listener.LoggingErrorHandler : Error while processing: null

简单记录下使用kafka遇到的问题,万一也会有小伙伴遇到了呢。 程序端使用springboot服务消费kafka,某天出现消息大量堆积,经过定位到错误日志如下:...

超详细kafka教程来啦

超详细kafka教程来啦

Kafka的概念和入门 Kafka是一个消息系统。由LinkedIn于2011年设计开发。 Kafka是一种分布式的,基于发布/订阅的消息系统。主要设计目标如下:...

Kafka入门学习(一)

Kafka入门学习(一)

用简单的话来说,你可以把Kafka当作可顺序写入的一大卷磁带, 可以随时倒带,快进到某个时间点重放。   ====常用开源分布式消息系统 *集...

kafka部署安装

Kafka集群环境搭建部署 1 Kafka的安装部署需要安装jdk [root@kafka-1 ~]# rpm -ivh jdk-8u191-linux-x64....

kafka插件在logstash上的安装

安装按照官方文档完全自动化的安装.或是可以通过以下方式手动自己安装插件,不过重点注意的是 kafka 的版本,上面已经指出了。...

Kafka与.net core(一)安装

Kafka与.net core(一)安装

1.安装JDK 目前官网不能直接下载,在网上找到1.8.0版本安装包下载到本地。 1.1.下载jdk并解压 [root@iz2zei2y693gtrgwlib...