C# RSS：新闻抓取正文并转TXT

如果你喜欢手机阅读

如果宿舍手机几乎没CMNET信号

如果你不想浪费手机流量

如果你只想睡前静静浏览今天的新闻

以下程序抓取了 cnblogs,cnbeta,网易深度,南方周末的首页正文,可添加其它网站

using System;

using System.Collections.Generic;

using System.Linq;

using System.Text;

using System.Text.RegularExpressions;

using System.Net;

using System.Collections;

using System.Threading;

using System.IO;

using System.Configuration;

namespace RSS

{

    class Program

    {

      

        static void Main(string[] args)

        {

            string file="i://";



            {

                GetItem gi1 = new GetItem();

                gi1.pageUrl = "http://news.cnblogs.com/n/page/";

                gi1.prefix = "http://news.cnblogs.com";

                gi1.pageUrlsRegex = "\"(?<url>/n/[\\d]+?)\"";

                gi1.titleRegex = "<div id=\"news_title\"><a.*?>(?<title>.*?)</a>";

                gi1.timeRegex = "<span class=\"time\">(?<time>.*?)</span>";

                gi1.bodyRegex = "<div id=\"news_body\">(?<body>.*?)</div>";

                gi1.hostName = "CnBlogs";

                gi1.encoding = "utf-8";

                gi1.fileSave = string.Format("{2}{0}_{1}.txt", gi1.hostName, String.Format("{0:yyMMdd_HH-mm}", DateTime.Now), file);

                Console.WriteLine(gi1.fileSave);

                gi1.pageWantToGet = 20;

                gi1.threadStart();



            }



            //{

            //    GetItem gi2 = new GetItem();

            //    gi2.prefix = "http://www.cnbeta.com/";

            //    gi2.pageUrlsRegex = "\"(?<url>/articles/[\\d]+.htm?)\"";

            //    gi2.titleRegex = "id=\"news_title\">(?<title>.*?)</h3>";

            //    gi2.timeRegex = "id=\"news_author\"><span>(?<time>.*?)[|]";

            //    gi2.bodyRegex = "<div id=\"news_content\">(?<body>.*?)<!-- end newsBox news -->";

            //    gi2.hostName = "CnBeta";

            //    gi2.encoding = "gb2312";

            //    gi2.fileSave = string.Format("{2}{0}_{1}.txt", gi2.hostName, String.Format("{0:yyMMdd_HH-mm}", DateTime.Now), file);

            //    Console.WriteLine(gi2.fileSave);

            //    gi2.homeOnly = true;

            //    gi2.threadStart();



            //}



            //{

            //    GetItem gi2 = new GetItem();

            //    gi2.pageUrlsRegex = "\"(?<url>http://focus.news.163.com.[^>< ]*.html?)\"";

            //    gi2.prefix = "http://focus.news.163.com/";

            //    gi2.hasPrefix = false;//default:true

            //    gi2.hasManyPage = true;//default:false

            //    gi2.manyPageRegex = "<span class=\"s1 s3\">上一页</span>(?<np>.*?)下一页</a>";

            //    gi2.titleRegex = "id=\"h1title\">(?<title>.*?)</h1>";

            //    gi2.timeRegex = "<span class=\"info\">(?<time>.*?)来源";

            //    gi2.bodyRegex = "class=\"summary\"(?<body>.*?)<!-- 分页 -->";

            //    gi2.hostName = "163";

            //    gi2.encoding = "GBK";

            //    gi2.fileSave = string.Format("{2}{0}_{1}.txt", gi2.hostName, String.Format("{0:yyMMdd_HH-mm}", DateTime.Now), file);

            //    Console.WriteLine(gi2.fileSave);

            //    gi2.homeOnly = true;

            //    gi2.threadStart();



            //}

            //{

            //    GetItem gi2 = new GetItem();

            //    gi2.pageUrlsRegex = "\"(?<url>http://www.infzm.com/content/[\\d]+?)\"";

            //    gi2.prefix = "http://www.infzm.com/";

            //    gi2.hasPrefix = false;//default:true

            //    gi2.hasManyPage = false;//default:false

            //    //gi2.manyPageRegex = "<span class=\"s1 s3\">上一页</span>(?<np>.*?)下一页</a>";

            //    gi2.titleRegex = "<div id=\"detailContent\">[\\s]*<h1>[\\s]*(?<title>.*?)[\\s]*</h1>";

            //    gi2.timeRegex = "<span class=\"pubTime\">(?<time>.*?)</span>";

            //    gi2.bodyRegex = "<div id=\"content-context\">(?<body>.*?)<!--end #text-->";

            //    gi2.hostName = "infzm";

            //    gi2.encoding = "utf-8";

            //    gi2.fileSave = string.Format("{2}{0}_{1}.txt", gi2.hostName, String.Format("{0:yyMMdd_HH-mm}", DateTime.Now), file);

            //    Console.WriteLine(gi2.fileSave);

            //    gi2.homeOnly = true;

            //    gi2.threadStart();



            //}

            //Console.Read();

            

        }

    }

    class GetItem{

        public string pageUrl;

        public bool homeOnly = false;

        public bool hasPrefix = true;

        public int pageWantToGet = 1;

        public bool hasManyPage = false;

        public string manyPageRegex;

        public string prefix;

        private List<string> pageUrls;

        public string pageUrlsRegex;

        public string titleRegex;

        public string timeRegex;

        public string bodyRegex;

        public string fileSave;

        public string hostName;

        public string encoding;

        public void threadStart() {



            if(!prefix.EndsWith("/"))prefix+="/";

            ThreadStart ts = new ThreadStart(start);

            Thread th = new Thread(ts);

            th.Start();

            

        }

        private void start() {



            if (homeOnly) { 

                

                getPageUrls(-1);



            }

            else

            {



                for (int i = 1; i <= pageWantToGet; i++)

                    getPageUrls(i);

            }

            startGetAll();

        }

        private void WriteFile(string str) {

            FileStream fs = new FileStream(fileSave, FileMode.Append);

            StreamWriter streamWriter = new StreamWriter(fs,System.Text.Encoding.GetEncoding("gb2312"));

            streamWriter.WriteLine(str);

            streamWriter.Flush();

            streamWriter.Close();

            fs.Close();

        }

        private void deleteTag(ref string str)

        {

   

            str = Regex.Replace(str, "<[\\s]*p[^>]*>?>", "");

            str = Regex.Replace(str, "</[\\s]*p[\\s]*?>", "\r\n");

            str = Regex.Replace(str, "<[\\s]*br[\\s]*/[\\s]*[^>]*>?>", "\r\n");

            str = Regex.Replace(str, "<[\\s]*br[^>]*>?>", "");

            str = Regex.Replace(str, "</[\\s]*br[^>]*>?>", "\r\n");

            

            str = Regex.Replace(str, "<[\\s]*a[\\s]*[^>]*>?>", "");

            str = Regex.Replace(str, "</[\\s]*a[\\s]*[^>]*>?>", "");

            str = Regex.Replace(str, "<[\\s]*img[\\s]*[^>]*>?>", "");

            str = Regex.Replace(str, "</[\\s]*img[\\s]*[^>]*>?>", "");

            str = Regex.Replace(str, "<[\\s]*strong[\\s]*[^>]*>?>", "");

            str = Regex.Replace(str, "</[\\s]*strong[\\s]*[^>]*>?>", "");

            str = Regex.Replace(str, "<[\\s]*div[\\s]*[^>]*>?>", "");

            str = Regex.Replace(str, "</[\\s]*div[\\s]*[^>]*>?>", "");

            str = Regex.Replace(str, "<[\\s]*b[\\s]*[^>]*>?>", "");

            str = Regex.Replace(str, "</[\\s]*b[\\s]*[^>]*>?>", "");

            str = Regex.Replace(str, "<[\\s]*span[\\s]*[^>]*>?>", "");

            str = Regex.Replace(str, "</[\\s]*span[\\s]*[^>]*>?>", "");

            str = Regex.Replace(str, "<[\\s]*script[\\s]*[^>]*>?>", "");

            str = Regex.Replace(str, "</[\\s]*script[\\s]*[^>]*>?>", "");

            str = Regex.Replace(str, "<[\\s]*li[\\s]*[^>]*>?>", "");

            str = Regex.Replace(str, "</[\\s]*li[\\s]*[^>]*>?>", "");

            str = Regex.Replace(str, "<[\\s]*img[\\s]*[^>]*>?>", "");

            str = Regex.Replace(str, "</[\\s]*img[\\s]*[^>]*>?>", "");

            str = Regex.Replace(str, "<[\\s]*style[\\s]*[^>]*>?>", "");

            str = Regex.Replace(str, "</[\\s]*style[\\s]*[^>]*>?>", "");

            str = Regex.Replace(str, "<[\\s]*i[\\s]*[^>]*>?>", "");

            str = Regex.Replace(str, "</[\\s]*i[\\s]*[^>]*>?>", "");

            str = Regex.Replace(str, "<[\\s]*h3[\\s]*[^>]*>?>", "");

            str = Regex.Replace(str, "<[\\s]*h2[\\s]*[^>]*>?>", "");

            str = Regex.Replace(str, "</[\\s]*h3[\\s]*[^>]*>?>", "");

            str = Regex.Replace(str, "</[\\s]*h2[\\s]*[^>]*>?>", "");

            str = Regex.Replace(str, "<[\\s]*font[\\s]*[^>]*>?>", "");

            str = Regex.Replace(str, "</[\\s]*font[\\s]*[^>]*>?>", "");

            str = Regex.Replace(str, "<[\\s]*q[\\s]*[^>]*>?>", "");

            str = Regex.Replace(str, "</[\\s]*q[\\s]*[^>]*>?>", "");

            str = str.Replace("&rdquo;", "\"");

            str = str.Replace("&ldquo;", "\"");

            str = str.Replace("&lsquo;", "'");

            str = str.Replace("&rsquo;", "'");

            str = str.Replace("&nbsp;", " ");

            str = str.Replace("&hellip;", "…");

            str = str.Replace("&ndash;", "-");

            str = str.Replace("&mdash;", "—");

        }

        public GetItem()

        {

            //this.homeUrl = url;

            pageUrls = new List<string>(50);

        }

        private string getNextPageContent(string url) {



            Console.WriteLine(url);



            //Console.Read();



            try

            {

                HttpWebRequest req = (HttpWebRequest)HttpWebRequest.Create(url);

                //req.SendChunked = true;

                req.Method = "get";

                req.ContentType = "text/html;charset=utf-8";



                //req.AllowAutoRedirect = false;

                // req.Timeout = 50;

                //req.CookieContainer = cc;





                StringBuilder sb = new StringBuilder("");

                StringBuilder cont = new StringBuilder("");

                using (HttpWebResponse wr = req.GetResponse() as HttpWebResponse)

                {



                    System.IO.Stream respStream = wr.GetResponseStream();

                    System.IO.StreamReader reader = new System.IO.StreamReader(respStream, System.Text.Encoding.GetEncoding(this.encoding));

                    //Regex titler = new Regex(this.titleRegex, RegexOptions.Singleline);

                    //Regex timer = new Regex(this.timeRegex, RegexOptions.Singleline);

                    Regex bodyr = new Regex(this.bodyRegex, RegexOptions.Singleline);

                    do

                    {



                        sb.Append(reader.ReadLine());







                    } while (!reader.EndOfStream);



                    string str = sb.ToString();

                    //Console.WriteLine(sb);

                    //Match m = titler.Match(str);

                    //if (m.Success)

                    //{

                    //    Console.WriteLine("title:{0}", m.Groups["title"].Value);

                    //    //streamWriter.WriteLine(m.Groups["title"].Value);

                    //    cont.AppendLine(m.Groups["title"].Value);



                    //}

                    //cont.AppendLine(url);

                    //m = timer.Match(str);

                    //if (m.Success)

                    //{

                    //    Console.WriteLine("time:{0}", m.Groups["time"].Value);

                    //    cont.AppendLine(m.Groups["time"].Value);

                    //}

                    Match m = bodyr.Match(str);

                    if (m.Success)

                    {

                        string body = m.Groups["body"].Value;



                        deleteTag(ref body);

                        Console.WriteLine("已获取下一页正文");

                        return body;

                    }

                   



                }

            }

            catch (Exception ex)

            {

                Console.WriteLine("异常:{0}",ex.Message);

                return "";

            }

            return "";

        

        

        

        }

        private void getContent(string url,int index,int total)

        {

            Console.WriteLine(url);



            //Console.Read();

            

            try

            {

                HttpWebRequest req = (HttpWebRequest)HttpWebRequest.Create(url);

                

                req.Method = "get";

                req.ContentType = "	text/html;charset=utf-8";

                

                //req.

                //req.AllowAutoRedirect = false;

                // req.Timeout = 50;

                //req.CookieContainer = cc;





                StringBuilder sb = new StringBuilder("");

                StringBuilder cont = new StringBuilder("");

                using (HttpWebResponse wr = req.GetResponse() as HttpWebResponse)

                {

                   

                    System.IO.Stream respStream = wr.GetResponseStream();

                    System.IO.StreamReader reader = new System.IO.StreamReader(respStream, System.Text.Encoding.GetEncoding(this.encoding));

                    Regex titler = new Regex(this.titleRegex, RegexOptions.Singleline);

                    Regex timer = new Regex(this.timeRegex, RegexOptions.Singleline);

                    Regex bodyr = new Regex(this.bodyRegex, RegexOptions.Singleline);

                    do

                    {



                        sb.Append(reader.ReadLine());







                    } while (!reader.EndOfStream);



                    string str = sb.ToString();

                    //Console.WriteLine(sb);

                    Match m = titler.Match(str);

                    if (m.Success) {

                        Console.WriteLine("title:{0}",m.Groups["title"].Value);

                        //streamWriter.WriteLine(m.Groups["title"].Value);

                        cont.AppendLine(m.Groups["title"].Value);

                        

                    }

                    cont.AppendLine(string.Format("({0}/{1}){2}",index,total,url));

                    m = timer.Match(str);

                    if (m.Success) {

                        Console.WriteLine("time:{0}", m.Groups["time"].Value);

                        cont.AppendLine(m.Groups["time"].Value);

                    }

                    m = bodyr.Match(str);

                    if (m.Success)

                    {

                        string body = m.Groups["body"].Value;



                        deleteTag(ref body);

                        Console.WriteLine("获取正文");

                        cont.AppendLine(body);

                    }

                    if (hasManyPage) {

                        

                        Regex mr = new Regex(this.manyPageRegex, RegexOptions.Singleline);

                        Match mm = mr.Match(str);

                        if (mm.Success) {

                            Console.WriteLine("存在多页..");

                            string pagesurl = mm.Groups["np"].Value;

                            Regex r = new Regex(this.pageUrlsRegex, RegexOptions.Singleline);

                            MatchCollection mc = r.Matches(pagesurl);

                            for (int i = 0; i < mc.Count; i++) {

                                string u = mc[i].Groups["url"].Value;

                                if (pageUrls.IndexOf(u) == -1) {



                                    pageUrls.Add(u);

                                    cont.AppendLine(getNextPageContent(u));

                                }

                            }

                        

                        }

                    

                    }

                    cont.AppendLine("--------------------------------------------------------------");

                    WriteFile(cont.ToString());

                  

                }

            }

            catch (Exception ex)

            {

                Console.WriteLine("异常:{0},{1}",ex.Source,ex.Message);

                return;

            }

            

        

        }

        private void startGetAll() {



            for (int i = 0; i < pageUrls.Count; i++)

            {

                string u;

                if (hasPrefix)

                {







                    if (pageUrls[i].StartsWith("/"))

                        u = string.Format("{0}{1}", prefix, pageUrls[i].Substring(1));

                    else u = string.Format("{0}{1}", prefix, pageUrls[i]);



                }

                else u = pageUrls[i];





                getContent(u, i, pageUrls.Count);



            }

        }

        private void getPageUrls(int pageIndex)

        {

            string url;

            if (pageIndex == -1) url = prefix;

            else url = string.Format("{0}{1}",this.pageUrl,pageIndex);

            Console.WriteLine(url);

            try

            {

                HttpWebRequest req = (HttpWebRequest)HttpWebRequest.Create(url);

                req.Method = "get";

                req.ContentType = "	text/html;charset=utf-8";



                //req.AllowAutoRedirect = false;

                // req.Timeout = 50;

                //req.CookieContainer = cc;





                StringBuilder sb = new StringBuilder("");

                using (HttpWebResponse wr = req.GetResponse() as HttpWebResponse)

                {



                    System.IO.Stream respStream = wr.GetResponseStream();

                    System.IO.StreamReader reader = new System.IO.StreamReader(respStream, System.Text.Encoding.GetEncoding(this.encoding));

                    Regex r = new Regex(this.pageUrlsRegex, RegexOptions.Singleline);

                    

                    do

                    {

                        

                        sb.Append(reader.ReadLine());







                    } while (!reader.EndOfStream);





                   // Console.WriteLine(sb);

                    MatchCollection m = r.Matches(sb.ToString());

                    //Console.WriteLine("regex:{0},matches:{1}", this.pageUrlsRegex, m.Count);

                    for (int i = 0; i < m.Count; i++) {

                        string temp = m[i].Groups["url"].Value;

                        //Console.WriteLine("index:{0},{1}", pageUrls.IndexOf(temp), temp);

                        if (pageUrls.IndexOf(temp) == -1) pageUrls.Add(temp);

                    }

                    Console.WriteLine("{0}:{1} articles.",this.hostName,pageUrls.Count);

                    

             

                    

                }

            }

            catch (Exception ex)

            {

                Console.WriteLine(ex.Message);

                Console.WriteLine("{0} end!", this.hostName);

                return;

            }

            Console.WriteLine("{0} end!", this.hostName);

        }

    }

}

注:project->add item->new xml file:app.config

like this:

<?xml version="1.0" encoding="utf-8" ?>
<configuration>
<system.net>
    <settings>
      <httpWebRequest useUnsafeHeaderParsing= "true" />
    </settings>
</system.net>
</configuration>

将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
【目标检测数据集】卡车数据集1073张VOC+YOLO格式熬夜写代码的平头哥∰ 目标检测 YOLO 人工智能
数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：1073标注数量(xml文件个数)：1073标注数量(txt文件个数)：1073标注类别数：1标注类别名称:["truck"]每个类别标注的框数：truck框数=1120总框数：1120使用标注工具：labelImg标注
钢筋长度超限检测检数据集VOC+YOLO格式215张1类别 futureflsl 数据集 YOLO 深度学习机器学习
数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：215标注数量(xml文件个数)：215标注数量(txt文件个数)：215标注类别数：1标注类别名称:["iron"]每个类别标注的框数：iron框数=215总框数：215使用标注工具：labelImg标注规则：对类别进
用Python实现读取统计单词个数程序媛了了 python 游戏 java
完整实例代码：fromcollectionsimportCounterdefpythonit():danci={}withopen("pythonit.txt","r",encoding="utf-8")asf:foriinf:words=i.strip().split()forwordinwords:ifwordnotindanci:danci[word]=1else:danci[word]+=
《前夫如龙》王昊江琼（独家小说）精彩TXT阅读海边书楼
《前夫如龙》王昊江琼（独家小说）精彩TXT阅读主角：王昊江琼简介：离婚那天，她视他如泥土。谁曾想，消息一出，天下震动！可关注微信公众号【风车文楼】去回个书号【203】，即可免费阅读【前夫如龙】全文！江芸并未听出华少龙声音里的冷漠，依旧一脸笑容道：“是啊，那个废物哪儿配得上我姐？这些年，我姐对他仁至义尽了。以后，华少爷可以多跟我姐接触接触，只有华少爷这样的人，才配得上我姐啊！”江琼低着头，微微有些娇
Mongodb Error: queryTxt ETIMEOUT xxxx.wwwdz.mongodb.net 佛一脚 error react mongodb 数据库
背景每天都能遇到奇怪的问题，做个记录，以便有缘人能得到帮助！换了一台电脑开发nextjs程序。需要连接mongodb数据，对数据进行增删改查。上一台电脑好好的程序，新电脑死活连不上mongodb数据库。同一套代码，没任何修改，搞得我怀疑人生了，打开浏览器进入mongodb官网毫无问题，也能进入线上系统查看数据，网络应该是没问题。于是我尝试了一下手机热点，这次代码能正常跑起来，连接数据库了！！！是不
《错嫁傻王：王妃她又黑化了》南君宥乔洛染（独家小说）精彩TXT阅读海边书楼
《错嫁傻王：王妃她又黑化了》南君宥乔洛染（独家小说）精彩TXT阅读主角：南君宥乔洛染简介：堂堂21世纪金牌特种兵乔洛染，穿来的第一天，就被人诬陷私通被逼投江。而前来解救她的，正是她的夫婿——智力受损的痴傻王爷南君宥。傻子娶了一个不贞女，全京城都在等着看他们的笑话。殊不知，乔洛染一手医术济天下，一手制毒退万敌。关注微信公众号【花车文学】去回个书號【36】，即可阅读【错嫁傻王：王妃她又黑化了】小说全文
《花都狂少》章小贝小说免费阅读【花都狂少TXT】完整版九月文楼
《花都狂少》章小贝小说免费阅读【花都狂少TXT】完整版主角：章小贝简介：开光师，是一种专门给新娘破瓜的职业。在我们那里，我被逼着做了一名开光师，专门做那些新郎官不敢做的事。一开始我很抵触，更怕早死。可是当我真的做了一次以后，就开始欲罢不能起来。小姐姐，别走，今晚，破瓜！关注微信公众号【风车文楼】去回个书号【267】，即可阅读【花都狂少】小说全文！“你怎么流鼻血了？”灵琴清惊讶的问。咳咳，我尴尬的咳
linux脚本sed替换变量,sed 命令中替换值为shell变量诺坎普之约 linux脚本sed替换变量
文章目录sed命令中替换值为shell变量替换基本语法sed中替换使用shell变量总结参考文档sed命令中替换值为shell变量替换基本语法大家都是sed有很多用法，最多就应该是替换一些值了。让我们先回忆sed的替换语法。在sed进行替换的时候sed-i's/old/new/g'1.txtecho"hellooldfrank"|sed's/old/new/g'结果如下：hellonewfrank
[数据集][目标检测]汽车头部尾部检测数据集VOC+YOLO格式5319张3类别 FL1623863129 数据集目标检测汽车 YOLO
数据集制作单位：未来自主研究中心(FIRC)版权单位：未来自主研究中心(FIRC)版权声明：数据集仅仅供个人使用，不得在未授权情况下挂淘宝、咸鱼等交易网站公开售卖,由此引发的法律责任需自行承担数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：5319标注数量(xml文件
爬虫技术抓取网站数据被限制怎么处理 Bearjumpingcandy 爬虫
爬虫技术用于抓取网站数据时，可能会遇到一些限制，常见的包括反爬机制、速率限制、IP封禁等。以下是应对这些情况的一些策略：尊重robots.txt：每个网站都有robots.txt文件，遵循其中的规定可以避免触犯网站的抓取规则。设置合理频率：控制爬虫请求的速度，通过添加延迟或使用代理服务器，减少对目标网站的压力。使用代理：获取并使用代理IP地址可以更换访问来源，降低被识别的可能性。模拟用户行为：使用
WORD批量转换器MultiDoc Converter uolian 工作 word
WORD批量转换器MultiDocConverterhttps://www.52pojie.cn/thread-1318745-1-1.html可批量将doc、docx等文件格式转成doc、docx、pdf、rtf、txt、html、epub等格式。安装包下载地址：https://wws.lanzouj.com/irvVbiz0pkd最终下载文件打包地址（未作成单文件，不确定是否可以直接使用）：h
《傲世龙帝》陆离柳诗雨（独家小说）精彩章节TXT阅读寒风书楼
《傲世龙帝》陆离柳诗雨（独家小说）精彩章节TXT阅读主角：陆离柳诗雨简介：他奉师命从神农架下山，遇到清纯可人的大小姐，冷傲的女总裁，医术、毒经、加上至尊实力，让他龙腾宇内，一手针法可救苍生，一手毒术可灭万敌，这天下，他一人可睥睨！可以关注微信公众号【九月文楼】去回个书號【167】，即可免费阅读【傲世龙帝】小说全文！陆离脸色越来越阴沉，他倒不是多喜欢这个慕容晚晴，毕竟，他只是听师傅说有这么一个未婚妻
GEO数据的下载和处理|GEO数据转换为Gene symbol|GEO注释文件提取symbol|查看样本标签|查看GEO数据疾病或正常|生物信息基础 Red Red 生信小技巧学习笔记生物信息 r语言 GEO数据库数据库
GEO数据的下载和处理|GEO数据转换为Genesymbol|GEO注释文件提取symbol|查看样本标签|查看GEO数据疾病或正常|生物信息基础数据的下载和处理首先在GEO数据库中通过GSEID找到相关数据，然后下载txt文件。数据读取与处理。#设置工作路径，也就是你的分析数据存放以及要保存到地方setwd(dir="C:\\Users\\LiaoMinzhen\\PycharmProjects
Python OS模块操作文件小丫头呀 #Python随笔 python
在Python中，可以使用os模块主要对文件进行重命名，删除等一些操作以下为os模块常用的方法示例:重命名操作importosos.rename('Test.txt','Test_重命名.txt')#参数1：要重命名的源文件#参数2：对源文件要重新命名的名称删除文件importosos.remove('Test_重命名.txt')#参数为要删除的源文件名称，如果该文件不存在则抛出异常创建空文件夹i
Python实验|磁盘垃圾文件清理器 cw11lq Python python
实验目的：1、熟练运用标准库os和os.path中的函数。2、理解sys库中argv成员用法。3、理解Python程序接收命令行参数的方式。4、理解递归遍历目录树的原理。5、了解从命令提示符环境运行Python程序的方式。实验内容：编写程序，实现磁盘垃圾文件清理功能。要求程序运行时，通过命令行参数指定要清理的文件夹，然后删除该文件夹及其子文件夹中所有扩展名为tmp、log、obj、txt以及大小为
《六年后，三个小祖宗带她抄了前夫家》霍寒爵姜星宁（独家小说）精彩TXT阅读九月文楼
《六年后，三个小祖宗带她抄了前夫家》霍寒爵姜星宁（独家小说）精彩TXT阅读主角：霍寒爵姜星宁简介：结婚三年，所有人嘲笑姜星宁是家庭主妇，早晚被抛弃，后来一语成谶。六年后，她摇身一变，成为炙手可热的知名服装设计师、文物修复师，身边还带着一对可爱的萌宝幼崽，追求者无数。某财阀大佬，“姜小姐，我集团还缺继承人，我看你的孩子很合适，所以，可以让我当他们的爸爸吗？”古董收藏家，“只要你嫁我，家里的所有古董、
10.web应用体系以及windows网络常见操作应用 XXX-17 软件测试软件测试
一、Dos命令1.启动方式：win+R，输入cmd2.切换盘符/路径：盘符名称+：（C:)cd目录（cdB111）（目录名按table键自动补全）3.查看目录：dirdir/p分页展示目录及文件dir/b展示文件名称4.创建文件夹：md文件夹名（mdt1)5.删除文件夹：rd文件夹名（rdt1）删除文件：del文件名（del222.txt）6.复制文件：copy复制文件目标路径（copymaste
15：00面试，15：06就出来了，问的问题有点变态。。 2401_86640859 面试职场和发展
应该考虑进行如何测试的测试方法怎样估计测试工作量?测试设计的问题当测试过程发生错误时，有哪几种解决办法?测试执行的问题测试评估的目标如何提高测试?C/S模式的优点和缺点B/S模式的优点和缺点…Linuxgrep和find的区别?grep都有哪些用法?查看IP地址?创建和删除一个多级目录?在当前用户家目录中查找haha.txt文件?如何查询出tomcat的进程并杀掉这个进程，写出linux命令?动态
使用pyinstaller配合nuitka打包，发布python程序孟德尔单杀豌豆射手 python
引言软件版本：pyinstaller6.3.0,nuitka2.0.3,win7及win11均已测试通过。使用本文打包方法打包完成后使用pyinstxtractor.py解包，源码均已加密。众所周知，python程序目前有两种常用的打包方式，pyinstaller及nuitka，根据我的经验总结，各自的优缺点如下：pyinstaller：打包速度很快，成功率很高，但是运行速度比nuitka打包的程
虚拟环境的创建和修改，删除撩本子高手 python pip conda
电脑有关环境的配置电脑版本为window10python==3.9.0Pip安装requirement.txt里面的第三方库pip安装requirement.txt的文件里面的第三方库，格式大概为如图所示。pipinstall-rrequirement.txtpip的虚拟环境的创建（使用方法为python3.x自带的venv）创建虚拟环境python-mvenvven_test#这里的话我是运用了
ubuntu16 jsoncpp1.9编译及使用 noscallion ubuntu json c++
文章目录前言1.下载jsoncpp2.解压并安装3.编译4.使用（1）创建项目文件夹，编写main.cpp文件。如下：（2）新建一个config.json的json文件：（3）创建CMakeLists.txt文件，内容如下：（4）新建build文件夹后记前言网上现有教程存在各种问题，比如jsoncpp是很老的版本。直接运行高版本安装包中提供的python脚本，在使用时会导致链接库等问题。使用CMa
【Trace】QQ+微信聊天记录分析工具 civilpy pandas
Trace-痕迹阿里云：https://www.alipan.com/s/x6fqXe1jVg1百度云:https://pan.baidu.com/s/1FmchOjK2wAMwE5aQds7pIw?pwd=td7s该工具使用前，先配置随机码（当前）：85EC【范例1】QQ个人聊天记录分析第1步：导出个人聊天记录或QQ群聊天记录，格式txt第2步：打开软件Trace-痕迹.exe，会自动弹出两个窗
ROS 自定义msg DIO哒
step1$roscd#进入package$mkdirmsg#创建msg目录step2在目录下新建Age.msgstep3修改CMakeList.txtstep4修改package.xml,加入message_generationmessage_runtimestep5到工作空间目录下，catkin_makestep6
【Mac/Linux终端快捷操作】Finder移动/复制/合并文件 TUTO_TUTO 终端快捷操作 linux macos 运维学习笔记
【注】所有使用相对路径的方法都需要：使用cd命令导航到指定文件夹目录（cd空格把文件夹直接拖进终端）补充在终端中使用cd命令导航文件系统:cd/full/path/to/folder进入特定文件夹。cdsubfolder进入当前目录的子文件夹。cd..返回上一级目录。cd或cd~返回主目录。注意:可以使用Tab键自动补全文件夹名1.多个txt文件中的内容合并成一个txt文件使用相对路径：cat./
Linux实操篇_实用指令_压缩和解压类指令 Shaw_Young
压缩和解压缩类gzip/gunzip指令gzip用于压缩文件,gunzip用于解压的基本语法语法功能描述gzip文件压缩文件,只能将文件压缩成为*.gz文件gunzip文件.gz解压缩文件命令应用实例案例1:gzip压缩,将/home下的hello.txt文件进行压缩[root@localhosthome]#gziphello.txt案例2:gunzip压缩,将/home下的hello.txt.g
linux-L3-linux 复制文件 robot_大菜鸟 linux_doti linux
linux中要将文件file1.txt复制到目录dir中，可以使用以下命令cpfile1.txtdir/复制文件cp/path/to/source/file/path/to/destination移动mv/path/to/source/file/path/to/destination复制文件夹内的文件cp-a/path/to/source/file/path/to/destination将文件夹内
docker_快速部署flask架构下的web容器打败404 docker flask 架构
保证你的机器上安装了docker并正常启动可参考阿里镜像站dockerflask项目结构如下：my-flask-app/├──Dockerfile├──app.py├──requirements.txt└──config/└──settings.pymy-flask-app/这是你的项目根目录，包含了所有与Flask应用相关的文件和配置。Dockerfile这个文件包含了构建Docker镜像所需的
《无双全才》李睿袁晶晶（独家小说）精彩TXT阅读海边书楼
《无双全才》李睿袁晶晶（独家小说）精彩TXT阅读主角：李睿袁晶晶简介：李睿在单位里被美女上司无情欺压，家里面老婆红杏出墙，陷入了人生最低谷。在一次防汛检查时，他跟上司袁晶晶闹翻，事后才知她是市里某领导的儿媳。山洪暴发，李睿凑巧救了某位贵人，自此成为了市里的大红人……关注微信公众号【寒风书楼】去回个书号【212】，即可阅读【无双全才】小说全文！来到外面，才在雷雨声中听到他们急切惊恐的叫喊。李睿高声喊
shell————文件名称截取背锅攻城师 shell
假设我们定义了一个变量为：file=/dir1/dir2/dir3/my.file.txt我们可以用${}分别替换获得不同的值：${file#/}：拿掉第一条/及其左边的字串：dir1/dir2/dir3/my.file.txt${file##/}：拿掉最后一条/及其左边的字串：my.file.txt${file#.}：拿掉第一个.及其左边的字串：file.txt${file##.}：拿掉最后一个
继之前的线程循环加到窗口中运行 3213213333332132 java thread JFrame JPanel
之前写了有关java线程的循环执行和结束，因为想制作成exe文件，想把执行的效果加到窗口上，所以就结合了JFrame和JPanel写了这个程序，这里直接贴出代码，在窗口上运行的效果下面有附图。 package thread; import java.awt.Graphics; import java.text.SimpleDateFormat; import java.util
linux 常用命令 BlueSkator linux 命令
1.grep 相信这个命令可以说是大家最常用的命令之一了。尤其是查询生产环境的日志，这个命令绝对是必不可少的。但之前总是习惯于使用（grep -n 关键字文件名）查出关键字以及该关键字所在的行数，然后再用（sed -n '100,200p' 文件名），去查出该关键字之后的日志内容。但其实还有更简便的办法，就是用（grep -B n、-A n、-C n 关键
php heredoc原文档和nowdoc语法 dcj3sjt126com PHP heredoc nowdoc
<!doctype html> <html lang="en"> <head> <meta charset="utf-8"> <title>Current To-Do List</title> </head> <body> <?
overflow的属性周华华 JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
《我所了解的Java》——总体目录 g21121 java
准备用一年左右时间写一个系列的文章《我所了解的Java》，目录及内容会不断完善及调整。在编写相关内容时难免出现笔误、代码无法执行、名词理解错误等，请大家及时指出，我会第一时间更正。 &n
[简单]docx4j常用方法小结 53873039oycg docx
本代码基于docx4j-3.2.0，在office word 2007上测试通过。代码如下: import java.io.File; import java.io.FileInputStream; import ja
Spring配置学习云端月影 spring配置
首先来看一个标准的Spring配置文件 applicationContext.xml <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi=&q
Java新手入门的30个基本概念三 aijuans java 新手 java 入门
17.Java中的每一个类都是从Object类扩展而来的。　　18.object类中的equal和toString方法。　　equal用于测试一个对象是否同另一个对象相等。　　toString返回一个代表该对象的字符串,几乎每一个类都会重载该方法,以便返回当前状态的正确表示.(toString 方法是一个很重要的方法)　　 19.通用编程:任何类类型的所有值都可以同object类性的变量来代替。　
《2008 IBM Rational 软件开发高峰论坛会议》小记 antonyup_2006 软件测试敏捷开发项目管理 IBM 活动
我一直想写些总结,用于交流和备忘,然都没提笔,今以一篇参加活动的感受小记开个头,呵呵! 其实参加《2008 IBM Rational 软件开发高峰论坛会议》是9月4号,那天刚好调休.但接着项目颇为忙,所以今天在中秋佳节的假期里整理了下. 参加这次活动是一个朋友给的一个邀请书,才知道有这样的一个活动,虽然现在项目暂时没用到IBM的解决方案,但觉的参与这样一个活动可以拓宽下视野和相关知识.
PL/SQL的过程编程,异常,声明变量,PL/SQL块百合不是茶 PL/SQL的过程编程异常 PL/SQL块声明变量
PL/SQL; 过程; 符号; 变量; PL/SQL块; 输出; 异常; PL/SQL 是过程语言(Procedural Language)与结构化查询语言(SQL)结合而成的编程语言PL/SQL 是对 SQL 的扩展,sql的执行时每次都要写操作
Mockito(三)--完整功能介绍 bijian1013 持续集成 mockito 单元测试
mockito官网：http://code.google.com/p/mockito/，打开documentation可以看到官方最新的文档资料。一.使用mockito验证行为 //首先要import Mockito import static org.mockito.Mockito.*; //mo
精通Oracle10编程SQL(8)使用复合数据类型 bijian1013 oracle 数据库 plsql
/* *使用复合数据类型 */ --PL/SQL记录 --定义PL/SQL记录 --自定义PL/SQL记录 DECLARE TYPE emp_record_type IS RECORD( name emp.ename%TYPE, salary emp.sal%TYPE, dno emp.deptno%TYPE ); emp_
【Linux常用命令一】grep命令 bit1129 Linux常用命令
grep命令格式 grep [option] pattern [file-list] grep命令用于在指定的文件(一个或者多个,file-list)中查找包含模式串(pattern)的行,[option]用于控制grep命令的查找方式。 pattern可以是普通字符串，也可以是正则表达式，当查找的字符串包含正则表达式字符或者特
mybatis3入门学习笔记白糖_ sql ibatis qq jdbc 配置管理
MyBatis 的前身就是iBatis，是一个数据持久层(ORM)框架。 MyBatis 是支持普通 SQL 查询，存储过程和高级映射的优秀持久层框架。MyBatis对JDBC进行了一次很浅的封装。以前也学过iBatis，因为MyBatis是iBatis的升级版本，最初以为改动应该不大，实际结果是MyBatis对配置文件进行了一些大的改动，使整个框架更加方便人性化。
Linux 命令神器：lsof 入门 ronin47 lsof
lsof是系统管理/安全的尤伯工具。我大多数时候用它来从系统获得与网络连接相关的信息，但那只是这个强大而又鲜为人知的应用的第一步。将这个工具称之为lsof真实名副其实，因为它是指“列出打开文件（lists openfiles）”。而有一点要切记，在Unix中一切（包括网络套接口）都是文件。有趣的是，lsof也是有着最多
java实现两个大数相加，可能存在溢出。 bylijinnan java实现
import java.math.BigInteger; import java.util.regex.Matcher; import java.util.regex.Pattern; public class BigIntegerAddition { /** * 题目：java实现两个大数相加，可能存在溢出。 * 如123456789 + 987654321
Kettle学习资料分享，附大神用Kettle的一套流程完成对整个数据库迁移方法 Kai_Ge Kettle
Kettle学习资料分享 Kettle 3.2 使用说明书目录概述..........................................................................................................................................7 1.Kettle 资源库管
[货币与金融]钢之炼金术士 comsci 金融
自古以来,都有一些人在从事炼金术的工作.........但是很少有成功的那么随着人类在理论物理和工程物理上面取得的一些突破性进展...... 炼金术这个古老
Toast原来也可以多样化 dai_lm android toast
Style 1：默认 Toast def = Toast.makeText(this, "default", Toast.LENGTH_SHORT); def.show(); Style 2：顶部显示 Toast top = Toast.makeText(this, "top", Toast.LENGTH_SHORT); t
java数据计算的几种解决方法3 datamachine java hadoop ibatis r-langue r
4、iBatis 简单敏捷因此强大的数据计算层。和Hibernate不同，它鼓励写SQL，所以学习成本最低。同时它用最小的代价实现了计算脚本和JAVA代码的解耦，只用20%的代价就实现了hibernate 80%的功能,没实现的20%是计算脚本和数据库的解耦。复杂计算环境是它的弱项，比如：分布式计算、复杂计算、非数据
向网页中插入透明Flash的方法和技巧 dcj3sjt126com html Web Flash
将 Flash 作品插入网页的时候，我们有时候会需要将它设为透明，有时候我们需要在Flash的背面插入一些漂亮的图片，搭配出漂亮的效果……下面我们介绍一些将Flash插入网页中的一些透明的设置技巧。　　一、Swf透明、无坐标控制　　首先教大家最简单的插入Flash的代码，透明，无坐标控制：　　注意wmode="transparent"是控制Flash是否透明
ios UICollectionView的使用 dcj3sjt126com
UICollectionView的使用有两种方法，一种是继承UICollectionViewController，这个Controller会自带一个UICollectionView；另外一种是作为一个视图放在普通的UIViewController里面。个人更喜欢第二种。下面采用第二种方式简单介绍一下UICollectionView的使用。 1.UIViewController实现委托，代码如
Eos平台java公共逻辑蕃薯耀 Eos平台java公共逻辑 Eos平台 java公共逻辑
Eos平台java公共逻辑 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月1日 17:20:4
SpringMVC4零配置--Web上下文配置【MvcConfig】 hanqunfeng springmvc4
与SpringSecurity的配置类似，spring同样为我们提供了一个实现类WebMvcConfigurationSupport和一个注解@EnableWebMvc以帮助我们减少bean的声明。 applicationContext-MvcConfig.xml  <
解决ie和其他浏览器poi下载excel文件名乱码 jackyrong Excel
使用poi,做传统的excel导出，然后想在浏览器中，让用户选择另存为，保存用户下载的xls文件，这个时候，可能的是在ie下出现乱码（ie,9,10,11),但在firefox,chrome下没乱码，因此必须综合判断，编写一个工具类： /** * * @Title: pro
挥洒泪水的青春 lampcy 编程生活程序员
2015年2月28日，我辞职了，离开了相处一年的触控，转过身--挥洒掉泪水，毅然来到了兄弟连，背负着许多的不解、质疑——”你一个零基础、脑子又不聪明的人，还敢跨行业，选择Unity3D？“，”真是不自量力••••••“，”真是初生牛犊不怕虎•••••“，••••••我只是淡淡一笑，拎着行李----坐上了通向挥洒泪水的青春之地——兄弟连！这就是我青春的分割线，不后悔，只会去用泪水浇灌——已经来到
稳增长之中国股市两点意见-----严控做空，建立涨跌停版停牌重组机制 nannan408
对于股市，我们国家的监管还是有点拼的，但始终拼不过飞流直下的恐慌，为什么呢？笔者首先支持股市的监管。对于股市越管越荡的现象，笔者认为首先是做空力量超过了股市自身的升力，并且对于跌停停牌重组的快速反应还没建立好，上市公司对于股价下跌没有很好的利好支撑。我们来看美国和香港是怎么应对股灾的。美国是靠禁止重要股票做空，在
动态设置iframe高度(iframe高度自适应) Rainbow702 JavaScript iframe contentDocument 高度自适应局部刷新
如果需要对画面中的部分区域作局部刷新，大家可能都会想到使用ajax。但有些情况下，须使用在页面中嵌入一个iframe来作局部刷新。对于使用iframe的情况，发现有一个问题，就是iframe中的页面的高度可能会很高，但是外面页面并不会被iframe内部页面给撑开，如下面的结构： <div id="content"> <div id=&quo
用Rapael做图表 tntxia rap
function drawReport(paper,attr,data){ var width = attr.width; var height = attr.height; var max = 0; &nbs
HTML5 bootstrap2网页兼容（支持IE10以下） xiaoluode html5 bootstrap
<!DOCTYPE html> <html> <head lang="zh-CN"> <meta charset="UTF-8"> <meta http-equiv="X-UA-Compatible" content="IE=edge">

C# RSS：新闻抓取正文并转TXT

你可能感兴趣的:(txt)