k8s全栈监控之metrics-server和prometheus--688IT编程网

k8s全栈监控之metrics-server和prometheus ⼀、概述

使⽤metric-server收集数据给k8s集内使⽤，如kubectl,hpa,scheduler等

使⽤prometheus-operator部署prometheus，存储监控数据

使⽤kube-state-metrics收集k8s集内资源对象数据

使⽤node_exporter收集集中各节点的数据

使⽤prometheus收集apiserver，scheduler，controller-manager，kubelet组件数据

使⽤alertmanager实现监控报警

使⽤grafana实现数据可视化

1、部署metrics-server

git clone github/cuishuaigit/k8s-monitor.git

cd k8s-monitor

我都是把这种服务部署在master节点上⾯，此时需要修改metrics-server-deployment.yaml

---

apiVersion: v1

kind: ServiceAccount

metadata:

namespace: kube-system

---

apiVersion: extensions/v1beta1

kind: Deployment

metadata:

namespace: kube-system

labels:

k8s-app: metrics-server

spec:

selector:

matchLabels:

k8s-app: metrics-server

template:

metadata:

labels:

k8s-app: metrics-server

spec:

serviceAccountName: metrics-server

tolerations:

- effect: NoSchedule

key: node.kubernetes.io/unschedulable

operator: Exists

- key: NoSchedule

operator: Exists

effect: NoSchedule

nodeselector

volumes:

# mount in tmp so we can safely use from-scratch images and/or read-only containers

- name: tmp-dir

emptyDir: {}

containers:

- name: metrics-server

image: io/metrics-server-amd64:v0.3.1

imagePullPolicy: Always

command:

- /metrics-server

- --kubelet-insecure-tls

--kubelet-preferred-address-types=InternalIP,Hostname,InternalDNS,ExternalDNS,ExternalIP

volumeMounts:

- name: tmp-dir

mountPath: /tmp

nodeSelector:

metrics: "yes"

为master节点添加label

kubectl label nodes ku metrics=yes

部署

kubectl create -f metrics-server/deploy/1.8+/

验证：

it's cool

注：metrics-server默认使⽤node的主机名，但是coredns⾥⾯没有物理机主机名的解析，⼀种是部署的时候添加⼀个参数：- --kubelet-preferred-address-types=InternalIP,Hostname,InternalDNS,ExternalDNS,ExternalIP

2、部署prometheus

下载相关⽂件：

前⾯部署metrics-server已经把所有的⽂件pull到本地了，所以直接使⽤

cd k8s-monitor

1.搭建nfs服务动态提供持久化存储

1.安装nfs

sudo apt-get install -y nfs-kernel-server

sudo apt-get install -y nfs-common

sudo vi /etc/exports

/data/opv *(rw,sync,no_root_squash,no_subtree_check)

注意将*换成⾃⼰的ip段，纯内⽹的话也可以⽤*，代替任意

sudo /etc/init.d/rpcbind restart

sudo /etc/init.d/nfs-kernel-server restart

sudo systemctl enable rpcbind nfs-kernel-server

客户端挂在使⽤

sudo apt-get install -y nfs-common

mount -t nfs ku13-1:/data/opv /data/opv -o proto=tcp -o nolock

为了⽅便使⽤将上⾯的mount命令直接放到.bashrc⾥⾯

2.创建namesapce

kubectl creaet -f nfs/monitoring-namepsace.yaml

3.为nfs创建rbac

kubectl create -f nfs/rbac.yaml

4.创建deployment，将nfs的地址换成⾃⼰的

kubectl create -f nfs/nfs-deployment.yaml

5.创建storageclass

kubectl create -f nfs/storageClass.yaml

2.安装Prometheus

cd k8s-monitor/Promutheus/prometheus

1.创建权限

kubectl create -f rbac.yaml

2.创建 node-exporter

kubectl create -f prometheus-node-exporter-daemonset.yaml

kubectl create -f prometheus-node-exporter-service.yaml

3.创建 kube-state-metrics

kubectl create -f kube-state-metrics-deployment.yaml

kubectl create -f kube-state-metrics-service.yaml

4.创建 node-directory-size-metrics

kubectl create -f node-directory-size-metrics-daemonset.yaml

5.创建 prometheus

kubectl create -f prometheus-pvc.yaml

kubectl create -f prometheus-core-configmap.yaml

kubectl create -f prometheus-core-deployment.yaml

kubectl create -f prometheus-core-service.yaml

kubectl create -f prometheus-rules-configmap.yaml

6.修改core-configmap⾥的etcd地址

3.安装Grafana

cd k8s-monitor/Promutheus/grafana

1.安装grafana service

kubectl create -f grafana-svc.yaml

2.创建configmap

kubectl create -f grafana-configmap.yaml

3.创建pvc

kubectl create -f grafana-pvc.yaml

4.创建gragana deployment

kubectl create -f grafana-deployment.yaml

5.创建dashboard configmap

kubectl create configmap "grafana-import-dashboards" --from-file=dashboards/ --namespace=monitoring

6.创建job，导⼊dashboard等数据

kubectl create -f grafana-job.yaml

查看部署：

prometheus和grafana都是采⽤的nodePort⽅式暴漏的服务，所以可以直接访问。

grafana默认的⽤户名密码：admin/admin

QA：

1、集是使⽤kubeadm部署的，controller-manager和schedule都是监听的127.0.0.1，导致prometheus收集不到相关的数据？可以在初始化之前修改其监听地址：

apiVersion: kubeadm.k8s.io/v1beta1

kind: ClusterConfiguration

controllerManager:

extraArgs:

address: 0.0.0.0

scheduler:

extraArgs:

address: 0.0.0.0

如果集已经构建好了：

sed -e "s/- --address=127.0.0.1/- --address=0.0.0.0/" -i /etc/kubernetes/manifests/kube-controller-manager.yaml

sed -e "s/- --address=127.0.0.1/- --address=0.0.0.0/" -i /etc/kubernetes/manifests/kube-scheduler.yaml

2、metrics-server不能使⽤，报错不能解析node节点的主机名？

需要修改deployment⽂件，

- --kubelet-preferred-address-types=InternalIP,Hostname,InternalDNS,ExternalDNS,ExternalIP

3、metrics-server报错，x509，证书是⾮信任的？

command:

- /metrics-server

- --kubelet-insecure-tls

4、完整的配置⽂件

containers:

- name: metrics-server

image: io/metrics-server-amd64:v0.3.1

command:

- /metrics-server

- --metric-resolution=30s

- --kubelet-insecure-tls

- --kubelet-preferred-address-types=InternalIP,Hostname,InternalDNS,ExternalDNS,ExternalIP

688IT编程网

k8s全栈监控之metrics-server和prometheus

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符回溯引用和前后查匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式选择题

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

688IT编程网

k8s全栈监控之metrics-server和prometheus

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符 回溯引用和前后查 匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式 选择题

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

java正则表达式选择题

非零金额正则表达式

基本的元字符回溯引用和前后查匹配模式

java正则表达式选择题

非零金额正则表达式