本文共 3573 字,大约阅读时间需要 11 分钟。
package mainimport ( "fmt" "log" "github.com/PuerkitoBio/goquery" "github.com/go-redis/redis" "net/http" "bytes" "github.com/astaxie/beego/toolbox")var ( redisClient *redis.Client //redis 缓存 //钉钉群机器人webhook地址 dingdingURL = "https://oapi.dingtalk.com/robot/send?access_token=dingding_talk_group_bot_webhook_token" //百度新闻搜索关键字URL baiduNewsUrlWithSearchKeyword = "http://news.baidu.com/ns?cl=2&rn=20&tn=news&word=%E7%89%A9%E8%81%94%E7%BD%91")const ( newsFeed = "news_feed"//爬取到的百度新闻redis key newsPost = "news_post"//已发送的百度新闻redis key newsList = "iot_news" //储存了的百度新闻redis key)//实例化redis缓存func init() { redisClient = redis.NewClient(&redis.Options{ Addr: "127.0.0.1:6379", Password: "ddfrfgtre4353252", // redis password DB: 0, // redis 数据库ID })}
在机器人管理页面选择“自定义”机器人,输入机器人名字并选择要发送消息的群。如果需要的话,可以为机器人设置一个头像。点击“完成添加”。
点击“复制”按钮,即可获得这个机器人对应的Webhook地址,赋值给 dingdingURl
func newsBot
func newsBot() error { // 获取html doc doc, err := goquery.NewDocument(baiduNewsUrlWithSearchKeyword) if err != nil { return nil } //使用redis pipeline 减少redis连接数 pipe := redisClient.Pipeline() // 使用selector xpath 语法获取有用信息 // 储存新闻到redis中 newsList // 储存新闻ur到redis-set 建newfeed 为以后是用sdiff 找出没有发送的新闻 doc.Find("div.result").Each(func(i int, s *goquery.Selection) { // For each item found, get the band and title URL, _ := s.Find("h3 > a").Attr("href") Source := s.Find("p.c-author").Text() Title := s.Find("h3 > a").Text() markdown := fmt.Sprintf("- [%s](%s) _%s_", Title, URL, Source) pipe.HSet(newsList, URL, markdown) pipe.SAdd(newsFeed, URL) }) //执行redis pipeline pipe.Exec()
//使用redis sdiff找出没有发送的新闻url unSendNewsUrls := redisClient.SDiff(newsFeed, newsPost).Val() //新闻按dingding文档markdonw 规范拼接 content := "" for _, url := range unSendNewsUrls { md := redisClient.HGet(newsList, url).Val() content = content + " \n " + md //记录已发送新闻的url地址 pipe.SAdd(newsPost, url) } pipe.Exec()
//如果有未发送新闻 请求钉钉webhook if content != "" { formt := ` { "msgtype": "markdown", "markdown": { "title":"IOT每日新闻", "text": "%s" } }` body := fmt.Sprintf(formt, content) jsonValue := []byte(body) //发送消息到钉钉群使用webhook //钉钉文档 https://open-doc.dingtalk.com/docs/doc.htm?spm=a219a.7629140.0.0.karFPe&treeId=257&articleId=105735&docType=1 resp, err := http.Post(dingdingURL, "application/json", bytes.NewBuffer(jsonValue)) if (err != nil) { return err } log.Println(resp) } return nil}
func newsBot
函数完成
func main() { //销毁redisClient defer redisClient.Close() //创建定时任务 //每天 8点 13点 18点 自动执行爬虫和机器人 // dingdingNewsBot := toolbox.NewTask("dingding-news-bot", "0 0 8,13,18 * * *", newsBot) //dingdingNewsBot := toolbox.NewTask("dingding-news-bot", "0 40 */1 * * *", newsBot) //err := dingdingNewsBot.Run() //检测定时任务 // if err != nil { // log.Fatal(err) // } //添加定时任务 toolbox.AddTask("dingding-news-bot", dingdingNewsBot) //启动定时任务 toolbox.StartTask() defer toolbox.StopTask() select {}}
go build main.gonohup ./main &
最终效果
转载地址:http://ycuta.baihongyu.com/