curl与wget高级技巧大揭秘 提升网络抓取效率
curl(文件传输工具) 常用参数如下: -c,–cookie-jar:将cookie写入到文件 -b,–cookie:从文件中读取cookie -C,–continue-at:断点续传 -d,–data:http post方式传送数据 -...
curl(文件传输工具) 常用参数如下: -c,–cookie-jar:将cookie写入到文件 -b,–cookie:从文件中读取cookie -C,–continue-at:断点续传 -d,–data:http post方式传送数据 -...
cgroups,其名称源自控制组群(control groups)的简写,是Linux内核的一个功能,用来限制,控制与分离一个进程组群的资源(如CPU、内存、磁盘输入输出等)。 这个项目最早是由Google的工程师在2006年发起(主要是P...
关于 Ceph 的介绍网上一大堆,这里就不重复了。Sage Weil 读博士的时候开发了这套牛逼的分布式存储系统,最初是奔着高性能分布式文件系统去的,结果云计算风口一来,Ceph 重心转向了分布式块存储(Block Storage)和分布式...
一些微信应用等等需要升级openssl到指定的版本才可使用。centos系统自带的版本过低,而使用yum升级也升级不到最新的版本上。下面以升级到openssl-1.1.0e版本为例来编译安装。 # wget https://www.open...
strace是什么? 按照strace官网的描述, strace是一个可用于诊断、调试和教学的Linux用户空间跟踪器。我们用它来监控用户空间进程和内核的交互,比如系统调用、信号传递、进程状态变更等。 strace底层使用内核的ptrace...
近期看到一篇通过微信实现Zabbix告警的文章,但实践时发现,无法成功发送消息。 分析原因,应该是微信公众平台加强了登录验证,在登录时会需要管理员进行扫描二维码操作才能成功登陆后台: 而之前文章中的API是通过账号密码模拟浏览器登陆方式,进...
前言 持续集成(CI/CD)是一种软件开发实践。用于帮助团队成员频繁、快速的集成,测试他们的工作成果,以尽快发现集成错误。 更频繁、更早的集成意味着更早的发现问题。通过持续集成,及时发现和解决代码故障,提高代码质量,减少故障处理成本等等。 ...
分组求和 awk '{s[$1] += $2}END{ for(i in s){ print i, s[i] } }' file1 > file2 以第一列 为变量名 第一列为变量,将相同第一列的第二列数据进行累加打印出和. awk...
需求背景: 之前发布了不少文章,后来发现之前的这些文章当时发布时都没有添加tag标签,然而现在需要都添加上tag标签,然而这个在默认的织梦后台是没办法批量实现的,只能一篇篇文章去修改。 思考: 织梦原本的文章批量管理中有这么几项,看图: 根...
博客站或者图片站运用AJAX异步无限加载,做成瀑布流,提高用户体验,这是AJAX异步加载的优点。 AJAX异步加载的弊端:属于WEB前端技术,蜘蛛不会抓JS调用的内容,也就是并不利于SEO优化。所以要运用这个功能的话最好有一部分直接...