python爬虫人工智能大数据

Shell 助力开发效率提升

(题图:毕业旅行之决战青海湖)

本文主要来源于小组内部的一个小的分享, 这里整理成一篇文章po出来. 题目叫 “Shell 助力开发效率提升”, 更切题的应该是叫 “命令行” 提升开发效率, 这里并没有讲到Shell编程, 而是主要介绍Linux 或者 Mac下常用的一些基本工具命令来帮助处理一些日常事务. (其实之前这篇文章Mac 软件推荐(续)之程序猿篇也大致提到了本文中的大部分内容)

通过本文的介绍, 你应该对相关命令有一个初步的了解, 知道比如用什么命令可以完成怎样的操作,
至于具体的参数, 你不用去刻意地记, 等到你用到的时候, 你再去 cmd --help 或者 man cmd去看, 用熟悉了, 常用的你也就记住了.

本文首先介绍了Linux/Mac下一些常用的命令行工具, 然后介绍了一些常用的命令, 最后通过一两个案例来说明这些工具的强大之处:
比如给定一个nginx日志文件, 能够找出HTTP 404 请求最多的top 10 是什么? 比如能找到请求耗时最多的top 10是什么? 再比如能够简单的得到每小时的”PV”是多少?
再比如拿到一篇文章, 能否简单统计一下这篇文章单次词频最高的10个词语是什么?

Mac 环境

zsh
on-my-zsh
plugin

git
autojump
osx(man-preview/quick-look/pfd(print Finder director)/cdf(cd Finder))

常用快捷键(bindkey)
演示: 高亮/git/智能补全/跳转(j,d)…

关于Mac相关的技巧, 更多的可以参考以下三篇文章: Mac 软件推荐, Mac 软件推荐(续) -- !程序猿篇, 和 Mac 软件推荐(续)之程序猿篇

Shell 基础命令

which/whereis, 常用 whatis, man, --help

  ➜  .oh-my-zsh git:(master)$ whereis ls
  /bin/ls
  ➜  .oh-my-zsh git:(master)$ which ls
  ls: aliased to ls -G

基本文件目录操作

  rm, mkdir, mv, cp, cd, ls, ln, file, stat, wc(-l/w/c), head, more, tail, cat...

利器管道: |

Shell 文本处理

这里就是通过案例讲了一下12个命令的大致用法和参数, 可以通过点击右边的目录直达你想要了解的命令.

find, grep, xargs, cut, paste, comm
join, sort, uniq, tr, sed, awk

find

常用参数

文件名 -name, 文件类型-type, 查找最大深度-maxdepth
时间过滤(create/access/modify) -[cam]time
执行动作 -exec

示例

  find ./ -name "*.json"
  find . -maxdepth 7 -name "*.json" -type f
  find . -name "*.log.gz" -ctime +7 -size +1M -delete (atime/ctime/mtime)
  find . -name "*.scala" -atime -7 -exec du -h {} \;

grep

常用参数

-v(invert-match),
-c(count),
-n(line-number),
-i(ignore-case),
-l, -L, -R(-r, —recursive), -e

示例

  grep 'partner' ./*.scala -l
  grep -e 'World' -e 'first' -i -R ./  (-e: or)

相关命令: grep -z / zgrep / zcat xx | grep

xargs

常用参数

-n(每行列数),
-I(变量替换)
-d(分隔符), Mac 不支持, 注意与GNU版本的区别

示例

  find . -type f -name "*.jpg" | xargs -n1 -I {} du -sh {}

cut

常用参数

-b(字节)
-c(字符)
-f(第几列), -d(分隔符), f范围: n, n-, -m, n-m

示例

 echo "helloworldhellp" | cut -c1-10
 cut -d, -f2-8 csu.db.export.csv

paste

常用参数

-d 分隔符
-s 列转行

示例

 ➜  Documents$ cat file1 1 11
 2 22
 3 33
 4 44
 ➜  Documents$ cat file2
 one     1
 two     2
 three   3
 one1    4

 ➜  Documents$ paste -d, file1 file2 1 11,one     1
 2 22,two     2
 3 33,three   3
 4 44,one1    4
 ➜  Documents$ paste -s -d: file1 file2
 a 11:b bb:3 33:4 44
 one     1:two     2:three   3:one1    4

join

类似sql中的 ...inner join ...on ..., -t 分隔符, 默认为空格或tab

➜  Documents$ cat j11 112 223 334 445 55➜  Documents$ cat j2
one     1   0one     2   1two     4   2three   5   3one1    5   4➜  Documents$ join -1 1 -2 3 j1 j21 11 one 22 22 two 43 33 three 54 44 one1 5

comm

常用参数

用法 comm [-123i] file1 file2
字典序列, 3列: 只在file1/file2/both
- 去掉某列, i 忽略大小写

示例

  ➜  Documents$ seq 1 5 >file11
  ➜  Documents$ seq 2 6 >file22
  ➜  Documents$ cat file11  1
  2
  3
  4
  5
  ➜  Documents$ cat file22  2
  3
  4
  5
  6
  ➜  Documents$ comm file11 file22  1
          2
          3
          4
          5
      6
  ➜  Documents$ comm -1 file11 file22      2
      3
      4
      5
  6
  ➜  Documents$ comm -2 file11 file22  1
      2
      3
      4
      5
  ➜  Documents$ comm -23 file11 file22  1

sort

常用参数

-d, —dictionary-order
-n, —numeric-sort
-r, —reverse
-b, —ignore-leading-blanks
-k, —key

示例

 ➜  Documents$ cat file2
 one     1
 two     2
 three   3
 one1    4
 ➜  Documents$ sort file2
 one     1
 one1    4
 three   3
 two     2
 ➜  Documents$ sort -b -k2 -r file2
 one1    4
 three   3
 two     2
 one     1

uniq

常用参数

-c 重复次数
-d 重复的
-u 没重复的
-f 忽略前几列

示例

 ➜  Documents$ cat file4 11
 22
 33
 11
 11
 ➜  Documents$ sort file4 | uniq -c    3 11
    1 22
    1 33
 ➜  Documents$ sort file4 | uniq -d
 11
 ➜  Documents$ sort file4 | uniq -u 22
 33
 ➜  Documents$ cat file3
 one     1
 two     1
 three   3
 one1    4
 ➜  Documents$ uniq -c -f 1 file3    2 one     1
    1 three   3
    1 one1    4

注意: uniq比较相邻的是否重复, 一般与sort联用

tr

常用参数

-c 补集
-d 删除
-s 压缩相邻重复的

示例

 ➜  Documents$ echo '1111234444533hello' | tr  '[1-3]' '[a-c]'
 aaaabc44445cchello
 ➜  Documents$ echo '1111234444533hello' | tr -d '[1-3]'
 44445hello
 ➜  Documents$ echo '1111234444533hello' | tr -dc '[1-3]'
 11112333
 ➜  Documents$ echo '1111234444533hello' | tr -s '[0-9]'
 123453hello
 ➜  Documents$ echo 'helloworld' | tr '[:lower:]' '[:upper:]'
 HELLOWORLD

sed

常用参数

-d 删除
-s 替换, g 全局
-e 多个命令叠加
-i 修改原文件(Mac下加参数 “”, 备份)

示例

 ➜  Documents$ cat file2
 one     1
 two     2
 three   3
 one1    4
 ➜  Documents$ sed "2,3d" file2
 one     1
 one1    4
 ➜  Documents$ sed '/one/d' file2
 two     2
 three   3
 ➜  Documents$ sed 's/one/111/g' file2 111     1
 two     2
 three   3
 1111    4
 #将one替换成111 并将含有two的行删除
 ➜  Documents$ sed -e 's/one/111/g' -e '/two/d' file2 111     1
 three   3
 1111    4
 # ()标记(转义), \1 引用
 ➜  Documents$ sed 's/\([0-9]\)/\1.html/g' file2
 one     1.html
 two     2.html
 three   3.html
 one1.html    4.html # 与上面一样 & 标记匹配的字符
 ➜  Documents$ sed 's/[0-9]/&.html/g' file2
 one     1.html
 two     2.html
 three   3.html
 one1.html    4.html
 ➜  Documents$ cat mobile.csv "13090246026"
 "18020278026"
 "18520261021"
 "13110221022"
 ➜  Documents$ sed 's/\([0-9]\{3\}\)[0-9]\{4\}/\1xxxx/g' mobile.csv "130xxxx6026"
 "180xxxx8026"
 "185xxxx1021"
 "131xxxx1022"

awk

基本参数和语法

NR 行号, NF 列数量
$1 第1列, $2, $3…
-F fs fs分隔符，字符串或正则
语法: awk 'BEGIN{ commands } pattern{ commands } END{ commands }', 流程如下:

执行begin
对输入每一行执行 pattern{ commands }, pattern 可以是正则/reg exp/, 关系运算等
处理完毕, 执行 end

示例

 ➜  Documents$ cat file5 11  11 aa cc 22  22 bb 33  33 d 11  11
 11  11
 #行号, 列数量, 第3列
 ➜  Documents$ awk '{print NR"("NF"):", $3}' file5 1(4): aa 2(3): bb 3(3): d 4(2): 5(2): #字符串分割, 打印1，2列
 ➜  Documents$ awk -F"xxxx" '{print $1, $2}' mobile.csv "130 6026"
 "180 8026"
 "185 1021"
 "131 1022"
 #添加表达式
 ➜  Documents$ awk '$1>=22 {print NR":", $3}' file5 2: bb 3: d #累加1到36，奇数，偶数
 ➜  Documents$ seq 36 | awk 'BEGIN{sum=0; print "question:"} {print $1" +"; sum+=$1} END{print "="; print sum}' | xargs | sed 's/+ =/=/'
 question: 1 + 2 + 3 + 4 + 5 + 6 + 7 + 8 + 9 + 10 + 11 + 12 + 13 + 14 + 15 + 16 + 17 + 18 + 19 + 20 + 21 + 22 + 23 + 24 + 25 + 26 + 27 + 28 + 29 + 30 + 31 + 32 + 33 + 34 + 35 + 36 = 666
 ➜  Documents$ seq 36 | awk 'BEGIN{sum=0; print "question:"} $1 % 2 ==1 {print $1" +"; sum+=$1} END{print "="; print sum}' | xargs | sed 's/+ =/=/'
 question: 1 + 3 + 5 + 7 + 9 + 11 + 13 + 15 + 17 + 19 + 21 + 23 + 25 + 27 + 29 + 31 + 33 + 35 = 324
 ➜  Documents$ seq 36 | awk 'BEGIN{sum=0; print "question:"} $1 % 2 !=1 {print $1" +"; sum+=$1} END{print "="; print sum}' | xargs | sed 's/+ =/=/'
 question: 2 + 4 + 6 + 8 + 10 + 12 + 14 + 16 + 18 + 20 + 22 + 24 + 26 + 28 + 30 + 32 + 34 + 36 = 342

其他高级语法: for, while 等, 各种函数等, 本身awk是一个强大的语言, 可以掌握一些基本的用法.

实际应用

日志统计分析

例如拿到一个nginx日志文件, 可以做很多事情, 比如看哪些请求是耗时最久的进而进行优化, 比如看每小时的”PV”数等等.

➜  Documents$ head -n5 std.nginx.log106.38.187.225 - - [20/Feb/2017:03:31:01 +0800] www.tanglei.name "GET /baike/208344.html HTTP/1.0" 301 486 "-" "Mozilla/5.0 (compatible; MSIE 7.0; Windows NT 5.1; .NET CLR 1.1.4322) 360JK yunjiankong 975382" "106.38.187.225, 106.38.187.225" - 0.000106.38.187.225 - - [20/Feb/2017:03:31:02 +0800] www.tanglei.name "GET /baike/208344.html HTTP/1.0" 301 486 "-" "Mozilla/5.0 (compatible; MSIE 7.0; Windows NT 5.1; .NET CLR 1.1.4322) 360JK yunjiankong 975382" "106.38.187.225, 106.38.187.225" - 0.00010.130.64.143 - - [20/Feb/2017:03:31:02 +0800] stdbaike.bdp.cc "POST /baike/wp-cron.php?doing_wp_cron=1487532662.2058920860290527343750 HTTP/1.1" 200 182 "-" "WordPress/4.5.6; http://www.tanglei.name/baike" "10.130.64.143" 0.205 0.20510.130.64.143 - - [20/Feb/2017:03:31:02 +0800] www.tanglei.name "GET /external/api/login-status HTTP/1.0" 200 478 "-" "-" "10.130.64.143" 0.003 0.00410.130.64.143 - - [20/Feb/2017:03:31:02 +0800] www.tanglei.name "GET /content_util/authorcontents?count=5&offset=0&israndom=1&author=9 HTTP/1.0" 200 11972 "-" "-" "10.130.64.143" 0.013 0.013

上面是nginx的一个案例, 例如希望找到top 10 请求的path:

head -n 10000 std.nginx.log | awk '{print $8 "," $10}' | grep ',404' | sort | uniq -c | sort -nr -k1 | head -n 10#orhead -n 10000 std.nginx.log | awk '$10==404 {print $8}' |sort | uniq -c | sort -nr -k1 | head -n 10

当然, 你可能一次不会直接处理成功, 一般会先少拿一部分数据进行处理看逻辑是否正常, 或者你可以缓存一些中间结果.

cat std.nginx.log | awk '{print $8 "," $10}' | grep ',404' >404.log
sort 404.log | uniq -c | sort -nr -k1 | head -n 10

再比如每小时请求数量, 请求耗时等等

➜  Documents$ head -n 100000 std.nginx.log | awk -F: '{print $1 $2}' | cut -f3 -d/ | uniq -c8237 20170315051 20170416083 20170518561 20170622723 20170719345 201708

其他实际案例 ip block

案例: db数据批处理

背景: 因为某服务bug, 导致插入到db的图片路径不对, 需要将形如(安全需要已经将敏感数据替换)
https://www.tanglei.name/upload/photos/129630//internal-public/shangtongdai/2017-02-19-abcdefg-eb85-4c24-883e-hijklmn.jpg
替换成
http://www.tanglei.me/internal-public/shangtongdai/2017-02-19-abcdefg-eb85-4c24-883e-hijklmn.jpg, 因为mysql等db貌似不支持直接正则的替换, 所以不能够很方便的进行写sql进行替换.
当然将数据导出, 然后写python等脚本处理也是一种解决方案, 但如果用上面的命令行处理, 只需要几十秒即可完成.

步骤:

准备数据

 select id, photo_url_1, photo_url_2, photo_url_3 from somedb.sometable where 
 photo_url_1 like 'https://www.tanglei.name/upload/photos/%//internal-public/%' or
 photo_url_2 like 'https://www.tanglei.name/upload/photos/%//internal-public/%' or
 photo_url_3 like 'https://www.tanglei.name/upload/photos/%//internal-public/%';

替换原文件
一般在用sed替换的时候, 先测试一下是否正常替换.

 #测试是否OK
 head -n 5 customers.csv | sed 's|https://www.tanglei.name/upload/photos/[0-9]\{1,\}/|http://www.tanglei.me|g'
 # 直接替换原文件, 可以sed -i ".bak" 替换时保留原始备份文件
 sed -i "" 's|https://www.tanglei.name/upload/photos/[0-9]\{1,\}/|http://www.tanglei.me|g' customers.csv

拼接sql, 然后执行

 awk -F, '{print "update sometable set photo_url_1 = " $2, ", photo_url_2 = " $3, ", photo_url_3 = " $4, " where id = " $1 ";" }' customers.csv > customer.sql #然后执行sql 即可

其他

play framework session

老方式: 需要启play环境, 慢

sbt "project site" consoleQuickimport play.api.libs._val sec = "secret...secret"var uid = "97522"Crypto.sign(s"uid=$uid", sec.getBytes("UTF-8")) + s"-uid=$uid"

新方式:

➜  Documents$  ~/stdcookie.sh 97522918xxxxdf64abcfcxxxxc465xx7554dxxxx21e-uid=97522➜  Documents$ cat ~/stdcookie.sh#!/bin/bash ##  cannot remove this lineuid=$1hash=`echo -n "uid=$uid" | openssl dgst -sha1 -hmac "secret...secret"`echo "$hash-uid=$uid"

统计文章单词频率: 下面案例统计了川普就职演讲原文中词频最高的10个词.

  ➜  Documents$ head -n3 chuanpu.txt
  Chief Justice Roberts, President Carter, President Clinton, President Bush, President Obama, fellow Americans and people of the world, thank you.

  We, the citizens of America, are now joined in a great national effort to rebuild our country and restore its promise for all of our people. Together we will determine the course of America and the world for many, many years to come.
  ➜  Documents$ cat chuanpu.txt | tr -dc 'a-zA-Z ' | xargs -n 1 | sort | uniq -c | sort -nr -k1 | head -n 20
    65 the    63 and    48 of    46 our    42 will    37 to    21 We    20 is    18 we    17 America    15 a    14 all    13 in
    13 for
    13 be    13 are    10 your    10 not    10 And    10 American

随机数

  ➜  Documents$ cat /dev/urandom | LC_CTYPE=C tr -dc 'a-zA-Z0-9' | fold -w 32 | head -n 5
  cpBnvC0niwTybSSJhUUiZwIz6ykJxBvu
  VDP56NlHnugAt2yDySAB9HU2Nd0LlYCW  0WEDzpjPop32T5STvR6K6SfZMyT6KvAI
  a9xBwBat7tJVaad279fOPdA9fEuDEqUd
  hTLrOiTH5FNP2nU3uflsjPUXJmfleI5c
  ➜  Documents$ cat /dev/urandom | head -c32 | base64
  WoCqUye9mSXI/WhHODHDjzLaSb09xrOtbrJagG7Kfqc=

图片处理压缩, 可批量改图片大小等等 sips

  ➜  linux-shell-more-effiency$ sips -g all which-whereis.png
  /Users/tanglei/Documents/linux-shell-more-effiency/which-whereis.png
    pixelWidth: 280
    pixelHeight: 81
    typeIdentifier: public.png
    format: png
    formatOptions: default
    dpiWidth: 72.000
    dpiHeight: 72.000
    samplesPerPixel: 4
    bitsPerSample: 8
    hasAlpha: yes
    space: RGB
    profile: DELL U2412M
  ➜  linux-shell-more-effiency$ sips -Z 250 which-whereis.png
  /Users/tanglei/Documents/linux-shell-more-effiency/which-whereis.png
    /Users/tanglei/Documents/linux-shell-more-effiency/which-whereis.png
  ➜  linux-shell-more-effiency$ sips -g all which-whereis.png
  /Users/tanglei/Documents/linux-shell-more-effiency/which-whereis.png
    pixelWidth: 250
    pixelHeight: 72
    typeIdentifier: public.png
    format: png
    formatOptions: default
    dpiWidth: 72.000
    dpiHeight: 72.000
    samplesPerPixel: 4
    bitsPerSample: 8
    hasAlpha: yes
    space: RGB
    profile: DELL U2412M
  ➜  linux-shell-more-effiency$ sips -z 100 30 which-whereis.png
  /Users/tanglei/Documents/linux-shell-more-effiency/which-whereis.png
    /Users/tanglei/Documents/linux-shell-more-effiency/which-whereis.png
  ➜  linux-shell-more-effiency$ sips -g pixelWidth -g pixelHeight which-whereis.png
  /Users/tanglei/Documents/linux-shell-more-effiency/which-whereis.png
    pixelWidth: 30
    pixelHeight: 100

Reference

Linux工具快速教程
Linux命令大全
Advanced Bash-Scripting Guide
UNIX环境高级编程

通过Amazon Bedrock API调用Anthropic Claude模型的实战指南 qwd41564qwd python
在AI技术的飞速发展中，AmazonBedrockAPI为开发者提供了一种稳定可靠的方式来访问Anthropic的Claude模型。无论是启动新的项目还是集成AI解决方案，通过Bedrock调用Claude模型都提供了更广泛的应用场景和便利性。本文将指导您如何在Python中通过AmazonBedrock向Claude模型发起API调用。技术背景介绍Bedrock是Amazon推出的一个集成平台，
React Hooks 基于 JS 闭包原理实现，但是闭包也会带来很多麻烦头脑旋风 javascript react.js 前端 react native
文章开始之前希望大家支持一下我独立开发的微信小程序“头脑旋风”，或微信扫描我的头像进入，谢谢支持~文章目录1.JS中的闭包2.ReactHooks中的闭包3.过时的闭包4.修复过时闭包的问题5.Hook中过时的闭包总结1.JS中的闭包下面定义了一个工厂函数createIncrement(i)，它返回一个increment函数。之后，每次调用increment函数时，内部计数器的值都会增加i。fun
基于ADB Shell 实现的 Android TV、电视盒子万能遥控器 — ADB Remote ATV sw-code adb android 电视盒子 tv
OrangePiZero3AndroidTV、电视盒子万能遥控器ADBRemoteATVAndroidTV的遥控器，基于ADBShell命令ADBRemoteATV是一个AndroidTV的遥控器，基于ADBShell命令，泛用性更高。下面的shell命令，是软件的基本原理，通过shell命令可模拟物理遥控器的基本按键，此外还可以快捷启动指定APP、借助手机软键盘输入中/英字符等。#输入事件adb
聊聊如何实现Android 放大镜效果咖啡老师 android
一、前言很久没有更新Android原生技术内容了，前些年一直在做跨端方向开发，最近换工作用重新回到原生技术，又回到了熟悉但有些生疏的环境，真是感慨万分。近期也是因为准备做地图交互相关的需求，功能非常复杂，尤其是交互部分，不过再复杂的交互，只要一点点将它拆解，分而治之，问题还是可以解决，就比如接下来要做的放大镜功能。二、功能设计该功能的场景是在操作地图时，对于边缘的精细化操作（像素级别的）需要在放大
机器视觉在医疗影像分析中的应用：助力放射科医生精准诊断人工智能专属驿站大数据人工智能计算机视觉
在现代医疗领域，影像学检查如X光、CT扫描和MRI等是诊断疾病的重要手段。随着技术的不断发展，机器视觉算法在医疗影像分析中的应用日益广泛，为放射科医生提供了强大的辅助工具，极大地提高了诊断的准确性和效率。本文将探讨机器视觉在医疗影像分析中的具体应用及其对医疗诊断带来的变革。一、机器视觉算法简介机器视觉是一种模拟人类视觉的科学技术，通过图像处理、模式识别和计算机视觉等技术，使计算机能够“看”懂图像中
JMeter：秒杀系统如何做接口压力测试程序员筱筱软件测试 jmeter 压力测试自动化测试软件测试功能测试程序人生职场和发展
秒杀系统是一种高并发的系统，需要处理大量的请求，而且在秒杀活动开始的瞬间，请求量会突然增加，这对系统的性能提出了很高的要求。为了确保系统的可靠性和稳定性，在开发和测试阶段，我们需要进行性能压力测试。在本篇文章中，我们将介绍如何使用jmeter对秒杀系统进行并发压力测试，同时体现登录参数化和循环请求接口并发100。确定性能测试目标和指标在进行性能测试之前，我们需要先确定测试的目标和指标。在秒杀系统中
C语言位域小宝哥Code C语言 c语言算法开发语言
在C语言中，位域（BitFields）是一种特殊的结构体成员，可以用来以位为单位定义数据成员的宽度。位域的主要作用是节省存储空间（特别是在嵌入式开发中）和对硬件寄存器进行位级操作。1.位域的定义与语法位域是在结构体中定义的一种特殊成员，通过冒号:指定其占用的位数。1.1语法struct结构体名{数据类型成员名:位宽;};数据类型：必须是整型或枚举类型（如int、unsignedint或signed
收藏！Python常用的第三方模块,你知道几个呢？ Python子木_ Python入门 Python学习 Python零基础 python pandas python教程 python基础 python学习 python入门青少年编程
作为一种流行的编程语言,拥有丰富的第三方模块,这些模块极大地扩展了的功能,使得各种开发任务变得更加高效和便捷.本文将介绍几种常用的第三方模块,提供示例展示,并对它们进行分类,以帮助读者更好地理解和使用这些工具.这里插播一条粉丝福利，如果你正在学习Python或者有计划学习Python，想要突破自我，对未来十分迷茫的，可以点击这里获取最新的Python学习资料和学习路线规划（免费分享，记得关注）1.
使用 RunnableParallel 并行执行步骤的实践指南 GEAWfaacc 服务器 linux 运维 python
在现代软件开发中，优化计算效率是非常关键的任务。尤其在涉及大规模数据处理或复杂计算时，并行执行成为提高性能的重要手段。LangChain提供了RunnableParallel工具，能够方便地将多个计算过程并行化执行。本文将通过实例代码，深入解析如何利用RunnableParallel实现计算过程的并行化。技术背景介绍RunnableParallel是一个强大的工具，可以将多个可运行的任务（即Run
【Linux奇遇记】我和Linux的初次相遇 2401_89210258 linux 状态模式运维
Linux的文件路径类型编辑Linux常用命令介绍Linux在生活中的应用全文总结前端和后端的介绍前端和后端是指现代Web应用程序的两个主要组成部分。1.前端前端（也称为客户端）是指向用户显示内容的所有方面。前端开发涉及使用HTML、CSS和JavaScript等技术来创建和维护Web应用程序的用户接口。2.后端后端（也称为服务器端）是指Web应用程序的非用户界面部分。后端开发涉及使用不同的编程语
shell流程控制般木h linux 运维服务器
流程控制是改变程序运行顺序的指令。1.if语句格式：iflist;thenlist;[eliflist;thenlist;]...[elselist;]fi1.1单分支if条件表达式;then命令fi示例：#!/bin/bashN=10if[$N-gt5];thenechoyesfi#bashtest.shyes1.2双分支if条件表达式;then命令else命令fi示例1：#!/bin/bash
【从零开始入门unity游戏开发之——C#篇46】C#补充知识点——命名参数和可选参数向宇it unity c#游戏引擎编辑器开发语言
考虑到每个人基础可能不一样，且并不是所有人都有同时做2D、3D开发的需求，所以我把【零基础入门unity游戏开发】分为成了C#篇、unity通用篇、unity3D篇、unity2D篇。【C#篇】：主要讲解C#的基础语法，包括变量、数据类型、运算符、流程控制、面向对象等，适合没有编程基础的同学入门。【unity通用篇】：主要讲解unity的基础通用的知识，包括unity界面、unity脚本、unit
Flutter The plugin “xxx“ requires a higher minimum iOS deployment version than.. 卡尔特斯 Flutter flutter ios
flutter开发，安装了插件，在运行iOS的时候报错：Error:Theplugin"mobile_scanner"requiresahigherminimumiOSdeploymentversionthanyourapplicationistargeting.Tobuild,increaseyourapplication'sdeploymenttargettoatleast15.5.0asde
预约功能的知识整理 Bailey395 java servlet 数据库
前置知识如果项目为小程序的开发项目中：我们确定数据库中有的字段有:预约人姓名、手机号、家人名称、预约时间根据我们的经定一表必须要有的6个字段：主键、创建时间、修改时间、创建人、修改人、备注使用我们现在有的字段为：主键、预约人姓名、手机号、家人姓名、预约时间、创建时间、修改时间、创建人、修改人、备注预约的状态也有4种,具体如下:待报道预约成功后已完成取消过期所以，预约表中最终的表字段为：主键、预约人
后端程序员基础篇（一） JAVA基础菜鸡来咯 java
在以往的博客中，大部分讲解的是框架的基础框架和功能模块，对于想要从事Web开发的同学来说，框架和各个功能模块固然非常重要，但这些都是建立在你有深厚的基础之上的，一开始学习的重点应该放在基础上面，在有了深厚的地基之后，学习框架和各个功能模块再之后的微服务等各个架构才能举一反三，学习得更加透彻接下来以我的逻辑来简要说明一下Web应用的开发人员的学习之路，算是帮助目前还比较迷茫的同学。Java基础，Sq
YOLOv8/YOLOv11使用web界面推理自己的模型，Gradio框架快速搭建挂科边缘 YOLOv8改进 YOLO 前端计算机视觉目标检测人工智能 python
前言Gradio是一个开源Python库，用于快速构建和共享机器学习模型的Web界面。开发者可以通过简单的Python代码将机器学习模型封装成交互式应用，无需复杂的设置即可在浏览器中使用自己训练好模型。接下来教你使用Gradio框架构建一个简单Web界面推理YOLOv8/YOLOv11模型。话不多说上检测结果：一、YOLOv8/YOLOv11源码下载YOLOv8源码下载：官网打不开的话，从我的网盘
python pipeline库_Easy Pipeline，一种轻量级的Python Pipeline库周不宅 python pipeline库
嗯，很久没有写博客了，最近的工作都是偏开发性质的，以至于没有时间对自己感兴趣的领域进行探索，感觉个人的成长停滞了一些。如何在枯燥的工作中，提取出有助于自己成长的养分，对于每个人来说都是不小的考验。这次，带来的是之前编写的一下挺简单的库，用来简化流水线作业的小框架。起因是这样的，组内有一个需求，需要挖掘视频中的检测难样本，这样可以极大地减少标注的量，从而降低成本。难样本挖掘的策略，简单来说就是如果视
pytest 通过实例讲清单元测试、集成测试、测试覆盖率 Coding Is Fun pytest 单元测试集成测试
1.单元测试概念定义:单元测试是对代码中最小功能单元的测试，通常是函数或类的方法。目标:验证单个功能是否按照预期工作，而不依赖其他模块或外部资源。特点:快速、独立，通常是开发者最先编写的测试。示例：pytest实现单元测试#功能模块：一个简单的数学函数defadd(x,y):"""加法函数"""returnx+ydefdivide(x,y):"""除法函数，包含除零检查"""ify==0:rais
【数据集】全球预报系统GFS概述：数据下载及处理 WW、forever 数据集 GFS
【数据集】全球预报系统GFS概述：数据下载及处理GFSweatherdata数据下载NOAANOMADSNOAA数据处理基于Python完成数据重命名参考GFSweatherdata全球预报系统GFS（GlobalForecastSystem）是美国国家海洋和大气管理局（NOAA）开发和运行的数值天气预报模型。它是一个全球性的大气模式，提供中长期天气预报。以下是一些关键点：全球覆盖：GFS提供全球
软件测试-进阶篇老式锅包肉：) python java 单元测试
文章目录测试分类1、按开发阶段划分1.1单元测试1.2集成测试1.3系统测试1.4验收测试2、按测试实施组织2.1α测试2.2β测试2.3第三方测试3、按是否运行划分3.1静态测试3.2动态测试4、按是否手工划分4.1手工测试4.2自动化测试5、按是否查看代码划分5.1黑盒测试5.2白盒测试5.3灰盒测试6、按测试地域划分6.1国际化测试与本地化测试7、按测试对像划分7.1业务测试7.2界面测试7
iPhone手机桌面必备：好用的便签/效率/美化/学习/生活工具 lee54621 智能手机学习生活
是不是总觉得自己的iPhone手机桌面不够酷炫、不够实用？看着千篇一律的布局，是不是觉得缺了点什么？别担心，今天就给大家分享一波iPhone手机桌面必备的好用App，让你的手机瞬间提升格调，实用性拉满，无论是学习、工作还是娱乐，都能得心应手，轻松拿捏，赶紧跟着我一起探索这些宝藏应用吧！》》效率提升类敬业签：可以和鸿蒙安卓电脑共享数据的云便签，集合便签、清单、提醒事项、日历、云盘、翻译、语音转文字、
使用 LangChain 构建多PDF文档聊天应用 jkgSFS langchain pdf easyui python
随着大型语言模型（LLMs）的普及，如何将它们应用于文档处理成为了热门话题之一。本文将通过一个教程，展示如何使用LangChain构建一个能够处理多个PDF文档并与之对话的应用。技术背景介绍LangChain是一个广受欢迎的库，能够帮助开发者轻松地与LLMs和不同的嵌入技术进行整合。它提供了方便的接口和工具，使得复杂的自然语言处理任务变得简单高效。核心原理解析我们将利用LangChain来读取多个
【前端异常】JavaScript错误处理：分析 Uncaught (in promise) error vip1024p vip1024p 前端 javascript 开发语言
在前端开发中，JavaScript异常是不可避免的。随着现代前端应用越来越多地使用异步操作(如Promise、async/await等)，开发者常常会遇到Uncaught(inpromise)error错误。这个错误是由于未正确处理Promise的拒绝(rejection)而导致的，常常出现在异步操作失败的情况下。如果不妥善处理，可能会导致应用的不稳定和用户体验的下降。本文将深入分析Uncaugh
【高级开发进阶】总篇 vip1024p java
未来一年我可能会以这个为主，写博文，待全部写完后会出书一本，希望大家有所收获第一篇性能调优专题****第1章Jvm1.1JVM类加载机制1.1.1启动类、扩展类、应用程序类加载器1.1.2手写自定义类加载器1.1.3双亲委派模型及如何打破1.2JVM内存模型1.2.1堆内存分代机制及对象生命周期1.2.2线程栈及栈帧内部结构1.2.3方法区（元空间）及常量池1.2.4程序计数器1.2.5本地方法栈
NextJs - antd5 降级兼容方案 Zong_0915 NextJs antd 前端
NextJs-antd5降级兼容方案前言一.降级解决方案1.1解决message等通知静态方法的样式丢失问题1.1解决非静态的样式兼容前言目前antd5对于SSR的兼容还有各方面都是很不错的，比如性能、UI设计等，不过，我们作为开发人员，在使用antd5作为UI组件库的时候，还需要考虑版本兼容问题，这里就说明下NextJs中如何进行antd5的降级。和本篇内容有关的前序文章：NextJs-SSR渲
基于R语言的DICE模型实践技术应用；评估气候变化对经济的影响以及不同减排政策的经济成本和效益 KY_chenzhao DICE模型 R语言气候变化
DICE模型是一个动态综合气候经济模型，由诺贝尔经济学奖得主WilliamNordhaus开发，用于评估气候变化对经济的影响以及不同减排政策的经济成本和效益。以下是一个关于DICE模型在气候变化影响评估中的实际应用案例，结合R语言代码进行讲解。实际案例：评估全球碳税政策的影响假设我们要评估一项全球碳税政策对经济增长、碳排放和气候变化的影响。我们将使用DICE模型的基本框架来进行分析。模型构建经济部
MDX语言的编程范式 BinaryBardC 包罗万象 golang 开发语言后端
MDX语言的编程范式引言MDX（MultidimensionalExpressions）是一种查询语言，主要用于在多维数据集中检索数据。这种语言广泛应用于商业智能（BI）领域，尤其是在与分析服务（如MicrosoftAnalysisServices）相关的上下文中。MDX语言提供了一个强大的语法，使得开发者能够以灵活的方式操作多维数据模型。本文将深入探讨MDX的编程范式，从基本语法、查询结构到高级
R语言的软件工程 BinaryBardC 包罗万象 golang 开发语言后端
R语言的软件工程1.引言随着数据科学的快速发展，R语言作为一种统计计算和图形绘制的编程语言，其在数据分析、可视化以及机器学习等领域的应用日益广泛。尽管R语言在数据处理上有其独特的优势，但要将其运用于大型项目和商业应用中，就需要遵循软件工程的原则。本篇文章将探讨R语言在软件工程中的应用，主要涵盖软件开发生命周期、代码规范、版本控制、测试和文档等方面。2.软件开发生命周期软件开发生命周期（SDLC）是
AI时代：前端工程师和数学家真的要失业了吗？前端
ExaCEO威廉·布里克近日发布的惊人预测在科技界引发轩然大波：他认为前端工程师将在三年内消失，而数学家则只有700天的时间。这一预测并非危言耸听，它反映了AI代码生成器等AI技术高速发展带来的巨大行业冲击。本文将深入探讨AI技术对前端开发和数学领域的影响，以及由此带来的机遇与挑战。前端开发行业的AI革命布里克的预测并非空穴来风。近年来，众多AI写代码工具如雨后春笋般涌现，例如ScriptEcho
软件架构的康威定律：AI如何重构团队协作模式前端
1.引言康威定律，一个简洁却深刻的观察：任何组织设计出的系统，其结构都与组织自身的沟通结构保持一致。这意味着，一个团队的沟通方式、组织结构直接影响着最终产品的架构。这在软件开发领域尤为明显。一个沟通效率低下的团队，往往会设计出复杂、难以维护的软件系统。而近年来，人工智能技术的飞速发展为解决这一问题提供了一种新的途径。本文将探讨AI工具，特别是AI辅助代码生成工具，如何帮助团队克服康威定律的限制，重
[星球大战]阿纳金的背叛 comsci
本来杰迪圣殿的长老是不同意让阿纳金接受训练的......... 但是由于政治原因,长老会妥协了...这给邪恶的力量带来了机会所以......现代的地球联邦接受了这个教训...绝对不让某些年轻人进入学院
看懂它，你就可以任性的玩耍了！ aijuans JavaScript
javascript作为前端开发的标配技能，如果不掌握好它的三大特点：1.原型 2.作用域 3. 闭包 ,又怎么可以说你学好了这门语言呢？如果标配的技能都没有撑握好，怎么可以任性的玩耍呢？怎么验证自己学好了以上三个基本点呢，我找到一段不错的代码，稍加改动，如果能够读懂它，那么你就可以任性了。 function jClass(b
Java常用工具包 Jodd Kai_Ge java jodd
Jodd 是一个开源的 Java 工具集，包含一些实用的工具类和小型框架。简单，却很强大！写道 Jodd = Tools + IoC + MVC + DB + AOP + TX + JSON + HTML < 1.5 Mb Jodd 被分成众多模块，按需选择，其中工具类模块有： jodd-core &nb
SpringMvc下载 120153216 springMVC
@RequestMapping(value = WebUrlConstant.DOWNLOAD) public void download(HttpServletRequest request,HttpServletResponse response,String fileName) { OutputStream os = null; InputStream is = null;
Python 标准异常总结 2002wmj python
Python标准异常总结 AssertionError 断言语句（assert）失败 AttributeError 尝试访问未知的对象属性 EOFError 用户输入文件末尾标志EOF（Ctrl+d） FloatingPointError 浮点计算错误 GeneratorExit generator.close()方法被调用的时候 ImportError 导入模块失
SQL函数返回临时表结构的数据用于查询 357029540 SQL Server
这两天在做一个查询的SQL，这个SQL的一个条件是通过游标实现另外两张表查询出一个多条数据，这些数据都是INT类型，然后用IN条件进行查询，并且查询这两张表需要通过外部传入参数才能查询出所需数据，于是想到了用SQL函数返回值，并且也这样做了，由于是返回多条数据，所以把查询出来的INT类型值都拼接为了字符串，这时就遇到问题了，在查询SQL中因为条件是INT值，SQL函数的CAST和CONVERST都
java 时间格式化 | 比较大小| 时区个人笔记 7454103 java eclipse tomcat c MyEclipse
个人总结！不当之处多多包含！引用 1.0 如何设置 tomcat 的时区：位置：(catalina.bat---JAVA_OPTS 下面加上) set JAVA_OPT
时间获取Clander的用法 adminjun Clander 时间
/** * 得到几天前的时间 * @param d * @param day * @return */ public static Date getDateBefore(Date d,int day){ Calend
JVM初探与设置 aijuans java
JVM是Java Virtual Machine（Java虚拟机）的缩写，JVM是一种用于计算设备的规范，它是一个虚构出来的计算机，是通过在实际的计算机上仿真模拟各种计算机功能来实现的。Java虚拟机包括一套字节码指令集、一组寄存器、一个栈、一个垃圾回收堆和一个存储方法域。 JVM屏蔽了与具体操作系统平台相关的信息，使Java程序只需生成在Java虚拟机上运行的目标代码（字节码）,就可以在多种平台
SQL中ON和WHERE的区别 avords
SQL中ON和WHERE的区别数据库在通过连接两张或多张表来返回记录时，都会生成一张中间的临时表，然后再将这张临时表返回给用户。 www.2cto.com 在使用left jion时，on和where条件的区别如下： 1、 on条件是在生成临时表时使用的条件，它不管on中的条件是否为真，都会返回左边表中的记录。
说说自信 houxinyou 工作生活
自信的来源分为两种,一种是源于实力,一种源于头脑.实力是一个综合的评定,有自身的能力,能利用的资源等.比如我想去月亮上,要身体素质过硬,还要有飞船等等一系列的东西.这些都属于实力的一部分.而头脑不同,只要你头脑够简单就可以了!同样要上月亮上,你想,我一跳,1米,我多跳几下,跳个几年,应该就到了!什么?你说我会往下掉?你笨呀你!找个东西踩一下不就行了吗? 无论工作还
WEBLOGIC事务超时设置 bijian1013 weblogic jta 事务超时
系统中统计数据，由于调用统计过程，执行时间超过了weblogic设置的时间，提示如下错误：统计数据出错! 原因：The transaction is no longer active - status: 'Rolling Back. [Reason=weblogic.transaction.internal
两年已过去，再看该如何快速融入新团队 bingyingao java 互联网融入架构新团队
偶得的空闲，翻到了两年前的帖子该如何快速融入一个新团队，有所感触，就记下来，为下一个两年后的今天做参考。时隔两年半之后的今天，再来看当初的这个博客，别有一番滋味。而我已经于今年三月份离开了当初所在的团队，加入另外的一个项目组，2011年的这篇博客之后的时光，我很好的融入了那个团队，而直到现在和同事们关系都特别好。大家在短短一年半的时间离一起经历了一
【Spark七十七】Spark分析Nginx和Apache的access.log bit1129 apache
Spark分析Nginx和Apache的access.log，第一个问题是要对Nginx和Apache的access.log文件进行按行解析，按行解析就的方法是正则表达式： Nginx的access.log解析正则表达式 val PATTERN = """([^ ]*) ([^ ]*) ([^ ]*) (\\[.*\\]) (\&q
Erlang patch bookjovi erlang
Totally five patchs committed to erlang otp, just small patchs. IMO, erlang really is a interesting programming language, I really like its concurrency feature. but the functional programming style
log4j日志路径中加入日期 bro_feng java log4j
要用log4j使用记录日志，日志路径有每日的日期，文件大小5M新增文件。实现方式 log4j: <appender name="serviceLog" class="org.apache.log4j.RollingFileAppender"> <param name="Encoding" v
读《研磨设计模式》-代码笔记-桥接模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 个人觉得关于桥接模式的例子，蜡笔和毛笔这个例子是最贴切的：http://www.cnblogs.com/zhenyulu/articles/67016.html * 笔和颜色是可分离的，蜡笔把两者耦合在一起了：一支蜡笔只有一种
windows7下SVN和Eclipse插件安装 chenyu19891124 eclipse插件
今天花了一天时间弄SVN和Eclipse插件的安装，今天弄好了。svn插件和Eclipse整合有两种方式，一种是直接下载插件包，二种是通过Eclipse在线更新。由于之前Eclipse版本和svn插件版本有差别，始终是没装上。最后在网上找到了适合的版本。所用的环境系统：windows7JDK：1.7svn插件包版本：1.8.16Eclipse：3.7.2工具下载地址：Eclipse下在地址：htt
[转帖]工作流引擎设计思路 comsci 设计模式工作应用服务器 workflow 企业应用
作为国内的同行，我非常希望在流程设计方面和大家交流，刚发现篇好文(那么好的文章，现在才发现，可惜)，关于流程设计的一些原理，个人觉得本文站得高，看得远，比俺的文章有深度，转载如下 ================================================================================= 自开博以来不断有朋友来探讨工作流引擎该如何
Linux 查看内存，CPU及硬盘大小的方法 daizj linux cpu 内存硬盘大小
一、查看CPU信息的命令 [root@R4 ~]# cat /proc/cpuinfo |grep "model name" && cat /proc/cpuinfo |grep "physical id" model name : Intel(R) Xeon(R) CPU X5450 @ 3.00GHz model name :
linux 踢出在线用户 dongwei_6688 linux
两个步骤： 1.用w命令找到要踢出的用户，比如下面： [root@localhost ~]# w 18:16:55 up 39 days, 8:27, 3 users, load average: 0.03, 0.03, 0.00 USER TTY FROM LOGIN@ IDLE JCPU PCPU WHAT
放手吧,就像不曾拥有过一样 dcj3sjt126com
内容提要：静悠悠编著的《放手吧就像不曾拥有过一样》集结“全球华语世界最舒缓心灵”的精华故事，触碰生命最深层次的感动，献给全世界亿万读者。《放手吧就像不曾拥有过一样》的作者衷心地祝愿每一位读者都给自己一个重新出发的理由，将那些令你痛苦的、扛起的、背负的，一并都放下吧！把憔悴的面容换做一种清淡的微笑，把沉重的步伐调节成春天五线谱上的音符，让自己踏着轻快的节奏，在人生的海面上悠然漂荡，享受宁静与
php二进制安全的含义 dcj3sjt126com PHP
PHP里，有string的概念。 string里，每个字符的大小为byte（与PHP相比，Java的每个字符为Character，是UTF8字符，C语言的每个字符可以在编译时选择）。 byte里，有ASCII代码的字符，例如ABC，123，abc，也有一些特殊字符，例如回车，退格之类的。特殊字符很多是不能显示的。或者说，他们的显示方式没有标准，例如编码65到哪儿都是字母A，编码97到哪儿都是字符
Linux下禁用T440s，X240的一体化触摸板(touchpad) gashero linux ThinkPad 触摸板
自打1月买了Thinkpad T440s就一直很火大，其中最让人恼火的莫过于触摸板。 Thinkpad的经典就包括用了小红点(TrackPoint)。但是小红点只能定位，还是需要鼠标的左右键的。但是自打T440s等开始启用了一体化触摸板，不再有实体的按键了。问题是要是好用也行。实际使用中，触摸板一堆问题，比如定位有抖动，以及按键时会有飘逸。这就导致了单击经常就
graph_dfs hcx2013 Graph
package edu.xidian.graph; class MyStack { private final int SIZE = 20; private int[] st; private int top; public MyStack() { st = new int[SIZE]; top = -1; } public void push(i
Spring4.1新特性——Spring核心部分及其他 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
配置HiveServer2的安全策略之自定义用户名密码验证 liyonghui160com
具体从网上看 http://doc.mapr.com/display/MapR/Using+HiveServer2#UsingHiveServer2-ConfiguringCustomAuthentication LDAP Authentication using OpenLDAP Setting
一位30多的程序员生涯经验总结 pda158 编程工作生活咨询
1.客户在接触到产品之后，才会真正明白自己的需求。　　这是我在我的第一份工作上面学来的。只有当我们给客户展示产品的时候，他们才会意识到哪些是必须的。给出一个功能性原型设计远远比一张长长的文字表格要好。 2.只要有充足的时间，所有安全防御系统都将失败。　　安全防御现如今是全世界都在关注的大课题、大挑战。我们必须时时刻刻积极完善它，因为黑客只要有一次成功，就可以彻底打败你。 3.
分布式web服务架构的演变自由的奴隶 linux Web 应用服务器互联网
最开始，由于某些想法，于是在互联网上搭建了一个网站，这个时候甚至有可能主机都是租借的，但由于这篇文章我们只关注架构的演变历程，因此就假设这个时候已经是托管了一台主机，并且有一定的带宽了，这个时候由于网站具备了一定的特色，吸引了部分人访问，逐渐你发现系统的压力越来越高，响应速度越来越慢，而这个时候比较明显的是数据库和应用互相影响，应用出问题了，数据库也很容易出现问题，而数据库出问题的时候，应用也容易
初探Druid连接池之二——慢SQL日志记录 xingsan_zhang 日志连接池 druid 慢SQL
由于工作原因，这里先不说连接数据库部分的配置，后面会补上，直接进入慢SQL日志记录。 1.applicationContext.xml中增加如下配置： <bean abstract="true" id="mysql_database" class="com.alibaba.druid.pool.DruidDataSourc