Uniq

linux文件合并

第一:两个文件的交集,并集前提条件:每个文件中不得有重复行1. 取出两个文件的并集(重复的行只保留一份)2. 取出两个文件的交集(只留下同时存在于两个文件中的文件)3. 删除交集,留下其他的行1. cat file1 file2 | sort | uniq > file32. cat file1 file2 | sort | uniq -d >...

『Linux学习笔记』7. 管道和过滤器 -- pipe

在Linux中, 管道(pipe)可以将一个命令的标准输出送往另一个命令的标准输入, 多个管道可以组成管道线(pipeline). 管道操作符 与重定向类似, 管道也拥有自己的操作符"|", 当多个命令使用"|"连接时, 就意味着它们位于同一管道中, 它们的标准输出与标准输入会依次相连. ls | less 上面这行代码中, ls所获取的当前目录内容将被传...

排序命令

一.sort sort 格式: sort [-fbMnrtuk] [file or stdin] -f:忽略大小写的差异 -b:忽略最前面的空格部分 -M:以月份的名字来排序 -n:使用“纯数字”进行排序 -r:反向排序 -u:就是uniq,相同的数据,仅出现一行代表 -t:分隔符。默认是用“Tab”健来分隔 -k:以那个区间来进行排序的意思   二.un...

Linux中查看CPU信息【转】

转自:http://blog.chinaunix.net/uid-23622436-id-3311579.html cat /proc/cpuinfo中的信息 processor       逻辑处理器的id。 physical id    物理封装的处理器的id。 core id        每个核心的id。 cpu cores      位于相同物...

nginx日志统计分析-shell

nginx日志分析常用命令,包括IP相关统计、页面访问统计、性能分析、蜘蛛抓取统计、TCP连接统计等相关命令的总结 1. IP相关统计 1.1 ip访问量统计 awk '{print $1}' access.log | sort -n | uniq | wc -l 1.2 查看某一时间段的IP访问量(5-6点) grep "07/Jan/2019:0[5-...

Linux实时查看日志,访问前10IP 和相关命令

Nginx日志分析可以获得很多有用的信息,现在来试试最基本的,获取最多访问的前10个IP地址及访问次数。 既然是统计,那么awk是必不可少的,好用而高效。 命令如下: awk '{a[$1] += 1;} END {for (i in a) printf("%d %s ", a[i], i);}' 日志文件 | sort -n | tail 首先用awk统...

elasticsearch去重计数

如果需要针对ES索引统计某个字段上出现的不同值的个数时,可以使用cardinality聚合查询完成: Post /urlAttributes/_search?search_type=count{  "aggs": {    "uniq_attr": {      "cardinality": {        "field": "domain"     ...