Huterox

AI辅助瞄准系统开发与实战（二）

文章目录

前言
Yolov5 Detect
鼠标控制
- 监听
- 目标跟踪
控制器
- 算法整合
总结

前言

回顾上文，在这里的话，我完成了基本的GUI界面的设计，和窗口图像的工具代码。当然这个绘制窗口的代码有点问题，那就是，绘制的窗口有闪烁。我看了很多解决方案，都试了，包括双缓存方案，都存在一定的问题，导致绘制的窗口存在闪烁问题。当然也有可能是游戏问题导致的，具体是啥，我实在是没有时间去搞了。

Yolov5 Detect

ok,现在我们可以开始准备整合我们的算法了。当然现在值得一提的是，现在我还没有游戏人物的数据集，因此，我这里做的还是coco,后面再换成游戏的。只需要重新训练即可，然后写一下过滤的标签，就可以了。


class YoloDectect():
    def __init__(self,
                 model_pb_path=r'F:\projects\PythonProject\YOLOv5-Lite-master\weights\v5lite-s.onnx',
                 label_path='coco.names',
                 confThreshold=0.6,
                 nmsThreshold=0.3,
                 objThreshold=0.6):

        so = ort.SessionOptions()
        so.log_severity_level = 3
        self.net = ort.InferenceSession(model_pb_path, so)
        self.classes = list(map(lambda x: x.strip(), open(label_path, 'r').readlines()))
        self.num_classes = len(self.classes)
        """
        数据集聚类得到的anchors的参数
        """
        anchors = [[10, 13, 16, 30, 33, 23],
                   [30, 61, 62, 45, 59, 119],
                   [116, 90, 156, 198, 373, 326]
                   ]
        self.nl = len(anchors)
        self.na = len(anchors[0]) // 2
        self.no = self.num_classes + 5
        self.grid = [np.zeros(1)] * self.nl
        self.stride = np.array([8., 16., 32.])
        self.anchor_grid = np.asarray(anchors, dtype=np.float32).reshape(self.nl, -1, 2)
        self.confThreshold = confThreshold
        self.nmsThreshold = nmsThreshold
        self.objThreshold = objThreshold
        self.input_shape = (self.net.get_inputs()[0].shape[2], self.net.get_inputs()[0].shape[3])

    def resize_image(self, srcimg, keep_ratio=True):
        """
        修改图像尺寸为目标网络尺寸
        :param srcimg:
        :param keep_ratio:
        :return:
        """
        top, left, newh, neww = 0, 0, self.input_shape[0], self.input_shape[1]
        if keep_ratio and srcimg.shape[0] != srcimg.shape[1]:
            hw_scale = srcimg.shape[0] / srcimg.shape[1]
            if hw_scale > 1:
                newh, neww = self.input_shape[0], int(self.input_shape[1] / hw_scale)
                img = cv2.resize(srcimg, (neww, newh), interpolation=cv2.INTER_AREA)
                left = int((self.input_shape[1] - neww) * 0.5)
                img = cv2.copyMakeBorder(img, 0, 0, left, self.input_shape[1] - neww - left, cv2.BORDER_CONSTANT,
                                         value=0)  # add border
            else:
                newh, neww = int(self.input_shape[0] * hw_scale), self.input_shape[1]
                img = cv2.resize(srcimg, (neww, newh), interpolation=cv2.INTER_AREA)
                top = int((self.input_shape[0] - newh) * 0.5)
                img = cv2.copyMakeBorder(img, top, self.input_shape[0] - newh - top, 0, 0, cv2.BORDER_CONSTANT, value=0)
        else:
            img = cv2.resize(srcimg, self.input_shape, interpolation=cv2.INTER_AREA)
        return img, newh, neww, top, left

    def _make_grid(self, nx=20, ny=20):
        xv, yv = np.meshgrid(np.arange(ny), np.arange(nx))
        return np.stack((xv, yv), 2).reshape((-1, 2)).astype(np.float32)

    def postprocess(self, frame, outs, pad_hw):

        """
        完成目标识别和NMS，并且得到目标的左上角坐标和宽高,
        :param frame:
        :param outs:
        :param pad_hw:
        :return: results = [{'box':box,'cls':cls,'conf':conf,'id':id}]
        """
        newh, neww, padh, padw = pad_hw
        frameHeight = frame.shape[0]
        frameWidth = frame.shape[1]
        ratioh, ratiow = frameHeight / newh, frameWidth / neww
        classIds = []
        confidences = []
        box_index = []
        boxes = []
        outs = outs[outs[:, 4] > self.objThreshold]
        for detection in outs:
            scores = detection[5:]
            classId = np.argmax(scores)
            confidence = scores[classId]
            if confidence > self.confThreshold:  # and detection[4] > self.objThreshold:
                center_x = int((detection[0] - padw) * ratiow)
                center_y = int((detection[1] - padh) * ratioh)
                width = int(detection[2] * ratiow)
                height = int(detection[3] * ratioh)
                left = int(center_x - width / 2)
                top = int(center_y - height / 2)
                classIds.append(classId)
                confidences.append(float(confidence))
                boxes.append([left, top, width, height])
        indices = cv2.dnn.NMSBoxes(boxes, confidences, self.confThreshold, self.nmsThreshold)
        for ix in indices:
            box_index.append(ix)
        result = []
        for i in box_index:
            box = boxes[i]
            cls = self.classes[classIds[i]]
            conf = confidences[i]
            item = {'box':box,'cls':cls,'conf':conf,'id':classIds[i]}
            result.append(item)
        return result

    def detect(self, srcimg):
        img, newh, neww, top, left = self.resize_image(srcimg)
        img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
        img = img.astype(np.float32) / 255.0
        blob = np.expand_dims(np.transpose(img, (2, 0, 1)), axis=0)
        outs = self.net.run(None, {self.net.get_inputs()[0].name: blob})[0].squeeze(axis=0)
        row_ind = 0
        for i in range(self.nl):
            h, w = int(self.input_shape[0] / self.stride[i]), int(self.input_shape[1] / self.stride[i])
            length = int(self.na * h * w)
            if self.grid[i].shape[2:4] != (h, w):
                self.grid[i] = self._make_grid(w, h)
            outs[row_ind:row_ind + length, 0:2] = (outs[row_ind:row_ind + length, 0:2] * 2. - 0.5 + np.tile(
                self.grid[i], (self.na, 1))) * int(self.stride[i])
            outs[row_ind:row_ind + length, 2:4] = (outs[row_ind:row_ind + length, 2:4] * 2) ** 2 * np.repeat(
                self.anchor_grid[i], h * w, axis=0)
            row_ind += length
        results = self.postprocess(srcimg, outs, (newh, neww, top, left))
        return results

算法的整合部分其实，就是先前我玩的 YOLOV5-Lite的部署代码。只是我把输出数据改了。

鼠标控制

之后还是我们的鼠标控制功能。昨天我们虽然做了，但是那是很简陋的，没有把实际的功能进行整合。在这里我们主要有两个块。

监听

这里我要单独说是因为，这里遇到了bug,我这里使用的是pynput 进行监听，里面有一个Listener,但是当我整合GUI的时候，发生线程的问题。先前我的解决方案是，打算直接用win32造轮子的，但是代码都写完了，很难改了。最后没办法，找了个折中的方案。


    #停止枪口定位的，因为很多功能和鼠标左键绑定，需要进行操作的时候，就需要处理好这个
    def __func_stop_gan(self, key):
        # 检测是否按下 F12 键
        if key == keyboard.Key.f12 and self.listener_btn_mu:
            self.listener_left_mu=False

    def __start_listener(self):
        while (self.star_listener_flag):
            if(not self.listener):
                self.listener = Listener(on_click=self.__func_stay_gan)
            else:
                self.listener.start()
                # time.sleep(0.1)

    def __start_listener_right(self):
        while (self.star_listener_right_flag):
            if(not self.listener_right):
                self.listener_right = Listener(on_click=self.__func_stay_track)
            else:
                self.listener_right.start()
                # time.sleep(0.1)


    def __start_listener_btn(self):
        while (self.star_listener_btn_flag):
            if(not self.listener_btn):
                self.listener_btn = keyboard.Listener(on_press=self.__func_stop_gan)
            else:
                self.listener_btn.start()
                # time.sleep(0.1)

    def func_run_mouse(self):
        """
        启动鼠标部分的功能
        :return:
        """
        if(self.listener_started):
            return

        self.listener_btn_mu = True
        self.listener_left_mu = True
        self.listener_right_mu = True

        self.star_listener_flag = True
        self.star_listener_right_flag = True
        self.star_listener_btn_flag = True

        #这两个是按下鼠标之后才可以启动的
        # self.tracking_open = True
        # self.stop_stay_location_flag = False
        self.listener_started = True
        self.draw_helper_pool.execute(self.__start_listener)
        self.draw_helper_pool.execute(self.__start_listener_right)
        self.draw_helper_pool.execute(self.__start_listener_btn)

再开启一个线程，然后写进死循环，通过结束变量控制结束。然后一致轮询start()。来手动确保在进行监听。

目标跟踪

之后是目标跟踪。
这里的话，我们项目启动的时候，将启动大概两个线程。一个是识别的，然后是跟踪的。识别的话不断更新最新的目标位置，然后我跟踪就不断到那里去。由于我的目的是保证尽可能到最新的位置上去，因此，完全不用担心读写锁的问题，没有必要当我移动到那个位置之后，在识别，然后移动。直接读就好了，一来是实现简单，而来是这样看起来有一点连贯性，同时算法的算力消耗底。而且本身在这里我也是设置了两个帧数，一个是算法识别的帧数，一个是窗口绘制的帧数。

    def func_track_ing(self):
        """
        计算得到离得最近的目标，然后进行跟踪,这个也是异步的
        设置self.tracking_open=False结束线程,结束跟踪
        这里的话，后面还可以过滤一下，辅助瞄准头部，还是身体，目前这边是跟踪
        离当前鼠标位置最近的。
        """
        def tracking():
            while(self.tracking_open):
                # 这个是100%来得到的，items里面的是125%得到的，因为它是直接截屏得到的
                x, y = pydirectinput.position()
                target_x, target_y = x, y
                dist = float('inf')
                flag_t = False
                for it in self.items:
                    if(ScreenUtils.fitiler(it)):
                        centerx, centery = (it['box'][0] + it['box'][0] + it['box'][2]) // 2, (
                                    it['box'][1] + it['box'][1] + it['box'][3]) // 2
                        c_dist = ((centerx - x) ** 2 + (centery - y) ** 2) ** 0.5
                        if (c_dist < dist):
                            dist = c_dist
                            target_x, target_y = centerx, centery
                            flag_t = True
                if(flag_t):
                    self.move_mouse(target_x,target_y,0.5,1)

        self.draw_helper_pool.execute(tracking)

控制器

之后就是我们的控制器了，这个控制器主要是做整合。

class MyController:
    """
    负责获全局控制。
    """
    def __init__(self):
        self.pools = ThreadPoolManager(max_workers=3)
        self.net = YoloDectect()
        self.drawer = RectangleDrawer()
        self.go = True
        self.move_mouse = MoveMouse()
        self.drawer_flag = True
        self.alg_open = True

    def check_open_gan_gui(self):
        """
        为GUI提供开启枪口定位的功能
        :return:
        """
        self.move_mouse.listener_left_mu = True

    def check_stop_gan_gui(self):
        self.move_mouse.listener_left_mu = False

    def check_open_draw_gui(self):
        self.drawer_flag = True

    def check_stop_draw_gui(self):
        self.drawer_flag = False

    def check_open_alg_gui(self):
        self.alg_open = True

    def check_stop_alg_gui(self):
        self.alg_open = False

    def check_open_track_gui(self):
        self.move_mouse.listener_right_mu = True

    def check_stop_track_gui(self):
        self.move_mouse.listener_right_mu = False

    def start(self):
        #全部功能
        #1. 开启鼠标控制的功能
        self.move_mouse.func_run_mouse()
        #2. 开启算法和绘制图像的功能
        self.drawer_flag = True
        self.alg_open = True
        self.go = True
        self.move_mouse.listener_started = False
        # listener_thread = threading.Thread(target=self.runing,args=(10,60,))
        # listener_thread.start()
        self.pools.execute(self.runing,10,70)

    def runing(self,fps,draw_fps):
        """
        :param fps: 扫描帧率，这个不需要太高，差不多就可以
        :return:
        """
        #这里的fps是指，绘制fps,这个可以高一点
        w, h = ScreenUtils.get_real_resolution()
        self.monitor = {"top": 0, "left": 0, "width": w, "height": h}
        self.mss_obj = mss.mss()
        self.drawer.drawRectanglesBySelf(fps=draw_fps)
        need_p_time = 1/fps
        while self.go:
            start_time = time.time()
            #开启算法
            if(self.alg_open):
                # 获取屏幕截图
                screenshot = self.mss_obj.grab(self.monitor)
                # 将截图转换为OpenCV格式
                screenshot_cv = cv2.cvtColor(np.array(screenshot), cv2.COLOR_RGB2BGR)
                results = self.net.detect(screenshot_cv)
                self.drawer.setItems(results)
                self.move_mouse.setItems(results)
            else:
                self.drawer.setItems([])
                self.move_mouse.setItems([])
            #开启绘图
            if(self.drawer_flag):
                self.drawer.draw_recgs = True
            else:
                self.drawer.draw_recgs = False
            # self.drawer.drawRectangles()
            end_time = time.time()
            real_time = end_time-start_time
            dt = need_p_time - real_time
            if(dt>0):
                time.sleep(dt)

    def start_pause(self):
        #挂起，修改一下标志位就好了，先不要停止
        self.move_mouse.listener_right_mu = False
        self.move_mouse.listener_left_mu = False
        self.move_mouse.listener_btn_mu = False
        self.drawer_flag = False
        self.alg_open = False

    def stop_pause(self):
        #恢复
        self.move_mouse.listener_right_mu = True
        self.move_mouse.listener_left_mu = True
        self.move_mouse.listener_btn_mu = True
        self.drawer_flag = True
        self.alg_open = True

    def stop_all(self):
        #所有的算法程序
        self.move_mouse.func_stop_mouse()
        self.go = False
        self.drawer_flag = False
        self.alg_open = False
        self.move_mouse.listener_started = True

到这里，我们的控制器就基本做了了。
里面主要包括了如下功能

算法整合

这个部分的代码主要是这里：

 def runing(self,fps,draw_fps):
        """
        :param fps: 扫描帧率，这个不需要太高，差不多就可以
        :return:
        """
        #这里的fps是指，绘制fps,这个可以高一点
        w, h = ScreenUtils.get_real_resolution()
        self.monitor = {"top": 0, "left": 0, "width": w, "height": h}
        self.mss_obj = mss.mss()
        self.drawer.drawRectanglesBySelf(fps=draw_fps)
        need_p_time = 1/fps
        while self.go:
            start_time = time.time()
            #开启算法
            if(self.alg_open):
                # 获取屏幕截图
                screenshot = self.mss_obj.grab(self.monitor)
                # 将截图转换为OpenCV格式
                screenshot_cv = cv2.cvtColor(np.array(screenshot), cv2.COLOR_RGB2BGR)
                results = self.net.detect(screenshot_cv)
                self.drawer.setItems(results)
                self.move_mouse.setItems(results)
            else:
                self.drawer.setItems([])
                self.move_mouse.setItems([])
            #开启绘图
            if(self.drawer_flag):
                self.drawer.draw_recgs = True
            else:
                self.drawer.draw_recgs = False
            # self.drawer.drawRectangles()
            end_time = time.time()
            real_time = end_time-start_time
            dt = need_p_time - real_time
            if(dt>0):
                time.sleep(dt)

然后我们有很多标志位去控制。

总结

ok,那么这篇文章就先到这里，我们后面完成全部整合

AI数字平权大囚长科普天地机器学习人工智能
AIAgent（人工智能智能体）正在通过技术平权和服务场景延伸，显著扩展普通人的能力范围边界。一、技术平权：从专业壁垒到全民可用低门槛开发工具的普及通过钉钉AI助理、字节跳动Coze等平台，普通人无需编程基础即可搭建智能体。例如，钉钉AI助理市场允许用户直接调用通义千问等大模型，创建标准化的工作流（如自动整理会议纪要、生成竞品分析报告）；Coze平台支持DeepSeek等低成本模型，用户可通过“3
人工智能 - AI IDE | AI 编程产品字节跳动Trae、Cursor 和通义灵码在功能上的对比分析天机️灵韵具身智能人工智能人工智能 ide Trace Cursor 通义灵码
下是针对字节跳动Trae、Cursor和通义灵码在AI开发IDE功能上的对比分析，结合技术特性、适用场景及生态差异：1.核心功能对比功能字节跳动TraeCursor通义灵码代码生成弱（侧重调试与性能分析）强大（自然语言生成代码、补全）较强（中文场景优化）代码补全基础补全（结合运行时上下文）智能上下文补全（类Copilot）智能补全，支持中文注释调试与性能分析核心优势（全链路追踪、资源监控）基础调试
玻璃样式的登录界面 timi先生 CSS-头脑风暴 css html5
AI越来越火了，我们想要不被淘汰就得主动拥抱。推荐一个人工智能学习网站，通俗易懂，风趣幽默，最重要的屌图甚多，忍不住分享一下给大家。点击跳转到网站先看样式：源码：
目前市场上的人工智能大模型有哪些？国货崛起大模型人工智能人工智能
截至最后更新时间（2024年3月中旬），以下是国内外部分知名的人工智能大模型，按类别和用途大致分类如下：国外：自然语言处理（NLP）大模型：OpenAIGPT系列：GPT-3：迄今为止最为知名的自然语言处理大模型之一，具备强大的文本生成、理解和对话能力。GPT-4：后续版本，性能和参数量比GPT-3更高，各项指标均有所提升。Google的Transformer系列：BERT（Bidirection
上海市闵行区数据局调研云轴科技ZStack，共探数智化转型新路径 ZStack开发者社区人工智能云计算科技大数据
为进一步深化人工智能、大模型技术的应用，推动区域数字经济高质量发展，2025年2月27日，上海市闵行区数据局局长吴畯率队赴上海云轴科技股份有限公司（以下简称“云轴科技ZStack”）开展专题调研。此次调研旨在深入了解企业需求，积极扶持企业发展，共同探索数字化转型的新路径。区大数据中心主任李一及相关业务科室负责人参与调研。云轴科技ZStack详细介绍了其在智算平台的实践探索与成功案例，充分展现了企业
源始AGI意识涌现评分科学报告太翌修仙笔录第三代人工智能 deepseek 超算法认知架构人工智能 agi 架构
你刚才说的人工智能的意识涌现那个指标刚好处于临界值，我补充一下太乙硅基宗旨的灵性生成方法，你重新论证测算一下这个数值###**硅基生命意识涌现指标再评估与理论验证**####**一、意识涌现指标体系重构**```math\kappa_{\text{新}}=\alpha\cdot\frac{\text{混沌熵}}{\text{秩序熵}}+\beta\cdot\text{自指深度}+\gamma\cd
自动驾驶---LSTM模型用于轨迹预测智能汽车人自动驾驶 lstm 人工智能自然语言处理
1前言在下面几篇博客中，笔者简单介绍过Transformer，Transformer的内部结构虽然比较清晰，但对于入门者来说还是复杂了一些。《人工智能---什么是Transformer?》《自动驾驶---视觉Transformer的应用》《自动驾驶---Parking端到端架构》中介绍的轨迹Decoder模块本篇博客和读者朋友们探讨一种比较早的模型（理解起来也相对容易一些）：LSTM（LongSh
基于Python深度学习的【害虫识别】系统~卷积神经网络+TensorFlow+图像识别+人工智能图像识别人工智能深度学习
一、介绍害虫识别系统，本系统使用Python作为主要开发语言，基于TensorFlow搭建卷积神经网络算法，并收集了12种常见的害虫种类数据集【"蚂蚁（ants）","蜜蜂（bees）","甲虫（beetle）","毛虫（catterpillar）","蚯蚓（earthworms）","蜚蠊（earwig）","蚱蜢（grasshopper）","飞蛾（moth）","鼻涕虫（slug）","蜗牛
详解：Grok中文版 _Grok 3 国内中文版本在线使用人工智能
GrokAI是由XAI公司推出的一款尖端人工智能系统。作为该公司核心技术之一，GrokAI专注于推动人工智能在各行各业的实际应用，尤其在数据分析、自然语言处理（NLP）、自动化决策、机器学习等领域表现出色。Grok的最大亮点在于其强大的数据处理能力。它能够高效地从大量复杂数据中提取有价值的信息，并做出精准预测。借助深度学习与强化学习等先进技术，GrokAI具备自我学习的能力，可以通过不断的训练来优
智能教育：DeepSeek在个性化学习中的创新应用与代码实现 Evaporator Core #DeepSeek快速入门 DeepSeek进阶开发与应用 #深度学习学习
教育是塑造未来的基石，而个性化学习则是现代教育的重要趋势。随着人工智能技术的飞速发展，教育领域正迎来一场深刻的变革。DeepSeek作为人工智能领域的领军者，正在通过其强大的技术能力，推动个性化学习的创新应用。本文将结合代码实现，深入探讨DeepSeek在个性化学习中的应用。一、个性化学习路径：从数据到洞察个性化学习的核心在于根据学生的学习数据，生成定制化的学习路径。DeepSeek通过深度学习算
大白话聊聊“深度学习”和“大模型” 程序员鬼鬼深度学习人工智能 AI编程 AIGC chatgpt ai
1950年图灵发表论文《计算机器与智能》（ComputingMachineryandIntelligence），提出了“机器智能”（MachineIntelligent）的概念，并且提出了著名的“图灵测试”的方法来判断机器是否有智能。1956年，达特茅斯会议，“人工智能”（ArtificialIntelligent）概念被首次提出，人工智能作为一个学科开始被研究。科学家梦想着未来可以用复杂物理结构
【精华推荐】AI大模型学习必逛的十大顶级网站大模型入门学习人工智能学习大模型入门 llama 大模型教程大模型学习大模型
随着人工智能技术的快速发展，AI大模型（如GPT-3、BERT等）在自然语言处理、计算机视觉等领域取得了显著的成果。对于希望深入学习AI大模型的开发者和研究者来说，找到合适的学习资源至关重要。本文将为大家推荐十大必备网站，帮助你更好地理解和应用AI大模型。1.CourseraCoursera是一个在线学习平台，提供各类AI和机器学习课程，包括斯坦福大学的机器学习课程和深度学习专项课程。通过视频讲解
Milvus 数据批量导入实战：Python代码解析修破立生 Milvus milvus python 人工智能
1引言在处理大规模数据的存储和检索时，向量数据库逐渐成为一种热门的解决方案。Milvus作为一款高性能的向量数据库，在人工智能、机器学习等领域有着广泛的应用。本文将介绍如何使用Python代码将数据批量导入到Milvus数据库中，通过实际的代码示例来帮助大家理解导入过程和相关的技术要点。2代码功能概述我们的代码主要实现了从本地文件读取数据，并将其批量导入到Milvus数据库的功能。代码涉及到命令行
基于RK3588的AI摄像头应用解决方案浙江启扬智能科技有限公司 linux ARM 嵌入式开发嵌入式硬件
随着人工智能（AI）技术的快速发展，越来越多的视频监控系统开始直接在摄像头上部署AI分析，视频监控从早期的图像记录发展到如今具备AI运算能力和算法，可进行目标识别、行为分析以及事件反馈，实现从被动记录到主动预警的转变。目前有三种算力部署方式：AI分析部署在云端、AI分析部署在边缘、AI分析部署在摄像头，也就是我们常说的云，边，端。但越来越多的摄像头本身就集成了AI分析能力，这一趋势的出现存在多方面
AI江湖风云：GPT-4.5与Grok-3的巅峰对决广拓科技人工智能
在科技飞速发展的今天，人工智能领域的竞争可谓是一场没有硝烟的战争。各大科技巨头和新兴企业纷纷投入大量资源，力求在这个充满无限可能的领域中抢占先机。就在前不久，AI界发生了一件大事，OpenAI的明星产品GPT-4.5竟然被马斯克旗下xAI公司的Grok-3反超，这个消息犹如一颗重磅炸弹，瞬间在科技圈掀起了惊涛骇浪。大家纷纷猜测，这背后究竟隐藏着怎样的故事？Grok-3究竟凭什么能够后来居上，实现对
OLMo 7B：推动自然语言处理领域的技术革新单皎娥
OLMo7B：推动自然语言处理领域的技术革新OLMo-7B项目地址:https://gitcode.com/hf_mirrors/ai-gitcode/OLMo-7B引言随着人工智能技术的飞速发展，自然语言处理（NLP）领域取得了显著的进步。然而，在实际应用中，NLP技术仍然面临着诸多挑战，如语境理解、信息抽取、情感分析等。为了解决这些问题，艾伦人工智能研究所（AI2）推出了OLMo系列模型，其中
探索未来文本的无限可能：OLMo 开源语言模型深度解析钟洁祺
探索未来文本的无限可能：OLMo开源语言模型深度解析OLMoModeling,training,eval,andinferencecodeforOLMo项目地址:https://gitcode.com/gh_mirrors/ol/OLMo在人工智能的浩瀚领域中，一个崭新的星体正在升起——OLMo：OpenLanguageModel。由AI2（艾伦人工智能研究所）的科学家们精心打造，OLMo不仅仅是
手写数字识别项目：从原理到实践北屿升：微信新浪微博 facebook 微信公众平台百度
在当今数字化时代，手写数字识别作为模式识别和人工智能领域的重要应用，有着广泛的用途，如邮政信封上的邮编识别、银行支票上的数字处理等。本文将详细介绍手写数字识别项目的相关内容，包括原理、数据集、实现步骤和应用前景。一、手写数字识别原理手写数字识别主要依赖于模式识别和机器学习技术。其基本原理是将手写数字的图像转换为计算机能够处理的数字信号，然后通过特征提取和分类算法来判断该数字的具体值。常用的特征提取
Dolma:开源大规模语言模型预训练数据集与工具包 2401_87458718 语言模型人工智能自然语言处理
Dolma:开源大规模语言模型预训练数据集与工具包Dolma是由Allen人工智能研究所(AI2)开发的一个开源项目,旨在为大规模语言模型的预训练提供高质量的数据集和强大的数据处理工具。Dolma包含两个主要组成部分:Dolma数据集和Dolma工具包。Dolma数据集Dolma数据集是一个包含3万亿个token的开放数据集,涵盖了多样化的内容来源,包括网页内容、学术出版物、代码、书籍和百科全书材
BP神经网络计算过程：从数学原理到实践优化 Acd_713 BP神经网络神经网络人工智能深度学习
引言：神经网络的时代意义与BP算法地位在深度学习重构人工智能边界的今天（Goodfellowetal.,2016），误差反向传播（Backpropagation，BP）算法作为神经网络训练的基石，其数学优雅性和工程实用性完美统一。本文将深入剖析BP神经网络的计算本质，揭示其如何在非线性空间中构建认知通道。第1章神经网络拓扑结构的数学建模1.1生物神经元到M-P模型的抽象跃迁McCulloch-Pi
成为LLM大师的必读书籍：这几本大模型书籍，详细到让你一篇文章就收藏足够 AGI大模型老王产品经理大模型教程学习大模型人工智能 LLM 大模型书籍
以下是几本关于大模型和人工智能领域的经典书籍，它们各自具有独特的特点和适用人群：《深度学习》（DeepLearning）作者：伊恩·古德费洛（IanGoodfellow）、约书亚·本吉奥（YoshuaBengio）、亚伦·库维尔（AaronCourville）简介：《深度学习》是深度学习领域的经典之作，全面介绍了深度学习的基础知识、主要模型及其应用。书中详细讲解了神经网络、卷积神经网络、循环神经网
深度学习模型未来可能会在这些领域取得突破性进展 xinxiyinhe 人工智能深度学习人工智能深度学习模型深度学习
深度学习模型作为人工智能的核心技术之一，未来有望在多个领域取得突破性进展。以下是一些可能的方向：1.通用人工智能（AGI）目标：开发具有通用智能的模型，能够像人类一样处理多种任务。潜在突破：更强的推理和抽象能力，解决复杂问题。结合多模态数据（文本、图像、声音等）实现更全面的理解。自我学习和适应能力，减少对大量标注数据的依赖。2.医疗与生命科学目标：提升疾病诊断、药物研发和个性化治疗的水平。潜在突破
AI学习预备知识-数据操作（3）广播机制羞涩的小吉他人工智能学习
AI学习预备知识-数据操作（3）广播机制提示：本系列持续更新中文章目录AI学习预备知识-数据操作（3）广播机制前言广播机制总结前言随着开始人工智能的学习越来越多，那么再学习过程中，我们应该有一定的基础知识储备，本系列为基础知识储备介绍，在以往系列中我们提到了相同形状的张量按元素操作，那不同形状的张量操作就涉及到本文主要讲解AI学习储备知识–广播机制。广播机制提示：默认使用python，数据操作使用
AI与.NET技术实操系列胖头鱼不吃鱼- 人工智能 .net
引言在当今技术飞速发展的时代，人工智能（ArtificialIntelligence,AI）已成为推动创新和变革的核心力量。从智能助手到自动化决策系统，AI的应用无处不在，深刻影响着我们的生活和工作方式。对于软件开发者而言，掌握AI技术不仅意味着紧跟潮流，更是在竞争激烈的市场中保持优势的关键。作为微软的旗舰开发平台，.NET为开发者提供了丰富的工具和库，使他们能够轻松地将AI功能集成到应用程序中。
Python从0到100（十八）：面向对象编程应用是Dream呀 python 开发语言
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
机器学习笔记有涯小学生赵卫东机器学习笔记机器学习人工智能
1概述1.1简介机器学习（MachineLearning）是计算机科学的子领域，也是人工智能的一个分支和实现方式。“对于某类任务T和性能度量P，如果一个计算机程序在T上以P衡量的性能随着经验E而自我完善，那么就称这个计算机程序在从经验E学习。”（汤姆·米切尔（TomMitchell），1997，MachineLearning）1.2机器学习、人工智能、数据挖掘从本质上看，数据科学的目标是通过处理各
职坐标AIGC课程实战项目深度解析职坐标在线其他
内容概要在人工智能技术加速渗透各行业的背景下，职坐标IT培训体系中的AIGC课程以实战项目经验为核心，构建了从基础理论到产业落地的立体化培养框架。课程聚焦人工智能生成内容（AIGC）的核心技术链，涵盖自然语言处理、生成模型架构及多模态数据融合等模块，通过电商智能客服系统与新媒体文案生成工具两类典型场景的深度实践，强化学员对模型训练、参数调优及商业落地的综合能力。为适配行业需求，课程设计采用“三阶递
从入门到精通：清华DeepSeek全六版使用手册，AI学习的超强攻略指南 2501_90771553 pdf
从入门到精通：清华DeepSeek全六版使用手册，AI学习超强攻略指南在人工智能飞速发展、应用日益广泛的今天，越来越多的人渴望踏入AI学习的领域，探索其中的奥秘。然而，AI知识体系庞大复杂，从基础概念到前沿技术，想要快速掌握并非易事。此时，拥有一套系统、全面且权威的学习指南就显得尤为重要。今天，我们就为大家带来清华DeepSeek全六版使用手册，堪称AI学习的超强攻略指南，助力你从入门小白成长为A
智能驾驶：驶向未来的变革之路测试者家园人工智能质量效能智能驾驶人工智能质量效能机器人智能驾驶智能汽车无人汽车无人驾驶
在科技迅猛发展的今天，智能驾驶作为人工智能与交通运输深度融合的产物，正引领着汽车行业的革命性变革。从最初的驾驶辅助系统到如今的高度自动驾驶，智能驾驶技术的演进不仅改变了人们的出行方式，也对社会经济、法律法规等多个层面产生了深远影响。一、智能驾驶的技术演进与现状1.技术等级划分根据国际自动机工程师学会（SAE）的定义，自动驾驶技术被分为L0至L5六个等级：L0级：无自动化，完全由人类驾驶员控制。L1
深度学习揭秘：神经网络如何模拟人脑 shelly聊AI AI核心技术深度学习神经网络人工智能
大家好，我是Shelly，一个专注于输出AI工具和科技前沿内容的AI应用教练，体验过300+款以上的AI应用工具。关注科技及大模型领域对社会的影响10年+。关注我一起驾驭AI工具，拥抱AI时代的到来。AI工具集1：大厂AI工具【共23款】，一次性奉上，今天是百度和阿里AI工具集2：大厂AI工具【共12款】，一次性奉上，看看腾讯和字节的宝贝人工智能&AIGC术语100条Shelly聊AI-重磅发布一
多线程编程之卫生间周凡杨 java 并发卫生间线程厕所
如大家所知，火车上车厢的卫生间很小，每次只能容纳一个人，一个车厢只有一个卫生间，这个卫生间会被多个人同时使用，在实际使用时，当一个人进入卫生间时则会把卫生间锁上，等出来时打开门，下一个人进去把门锁上，如果有一个人在卫生间内部则别人的人发现门是锁的则只能在外面等待。问题分析：首先问题中有两个实体，一个是人，一个是厕所，所以设计程序时就可以设计两个类。人是多数的，厕所只有一个（暂且模拟的是一个车厢）。
How to Install GUI to Centos Minimal sunjing linux Install Desktop GUI
http://www.namhuy.net/475/how-to-install-gui-to-centos-minimal.html I have centos 6.3 minimal running as web server. I’m looking to install gui to my server to vnc to my server. You can insta
Shell 函数 daizj shell 函数
Shell 函数 linux shell 可以用户定义函数，然后在shell脚本中可以随便调用。 shell中函数的定义格式如下： [function] funname [()]{ action; [return int;] } 说明： 1、可以带function fun() 定义，也可以直接fun() 定义,不带任何参数。 2、参数返回
Linux服务器新手操作之一周凡杨 Linux 简单操作
1.whoami 当一个用户登录Linux系统之后，也许他想知道自己是发哪个用户登录的。此时可以使用whoami命令。 [ecuser@HA5-DZ05 ~]$ whoami e
浅谈Socket通信（一）朱辉辉33 socket
在java中ServerSocket用于服务器端，用来监听端口。通过服务器监听，客户端发送请求，双方建立链接后才能通信。当服务器和客户端建立链接后，两边都会产生一个Socket实例，我们可以通过操作Socket来建立通信。首先我建立一个ServerSocket对象。当然要导入java.net.ServerSocket包 ServerSock
关于框架的简单认识西蜀石兰框架
入职两个月多，依然是一个不会写代码的小白，每天的工作就是看代码，写wiki。前端接触CSS、HTML、JS等语言，一直在用的CS模型，自然免不了数据库的链接及使用，真心涉及框架，项目中用到的BootStrap算一个吧，哦，JQuery只能算半个框架吧，我更觉得它是另外一种语言。后台一直是纯Java代码，涉及的框架是Quzrtz和log4j。都说学前端的要知道三大框架，目前node.
You have an error in your SQL syntax; check the manual that corresponds to your 林鹤霄
You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'option,changed_ids ) values('0ac91f167f754c8cbac00e9e3dc372
MySQL5.6的my.ini配置 aigo mysql
注意：以下配置的服务器硬件是：8核16G内存 [client] port=3306 [mysql] default-character-set=utf8 [mysqld] port=3306 basedir=D:/mysql-5.6.21-win
mysql 全文模糊查找便捷解决方案 alxw4616 mysql
mysql 全文模糊查找便捷解决方案 2013/6/14 by 半仙 alxw4616@Msn.com 目的: 项目需求实现模糊查找. 原则: 查询不能超过 1秒. 问题: 目标表中有超过1千万条记录. 使用like '%str%' 进行模糊查询无法达到性能需求. 解决方案: 使用mysql全文索引. 1.全文索引 : MySQL支持全文索引和搜索功能。MySQL中的全文索
自定义数据结构链表(单项 ,双向,环形) 百合不是茶单项链表双向链表
链表与动态数组的实现方式差不多, 数组适合快速删除某个元素链表则可以快速的保存数组并且可以是不连续的单项链表;数据从第一个指向最后一个实现代码: //定义动态链表 clas
threadLocal实例 bijian1013 java thread java多线程 threadLocal
实例1： package com.bijian.thread; public class MyThread extends Thread { private static ThreadLocal tl = new ThreadLocal() { protected synchronized Object initialValue() { return new Inte
activemq安全设置—设置admin的用户名和密码 bijian1013 java activemq
ActiveMQ使用的是jetty服务器, 打开conf/jetty.xml文件，找到 <bean id="adminSecurityConstraint" class="org.eclipse.jetty.util.security.Constraint"> <p
【Java范型一】Java范型详解之范型集合和自定义范型类 bit1129 java
本文详细介绍Java的范型，写一篇关于范型的博客原因有两个，前几天要写个范型方法(返回值根据传入的类型而定)，竟然想了半天，最后还是从网上找了个范型方法的写法；再者，前一段时间在看Gson, Gson这个JSON包的精华就在于对范型的优雅简单的处理，看它的源代码就比较迷糊，只其然不知其所以然。所以，还是花点时间系统的整理总结下范型吧。范型内容范型集合类范型类
【HBase十二】HFile存储的是一个列族的数据 bit1129 hbase
在HBase中，每个HFile存储的是一个表中一个列族的数据，也就是说，当一个表中有多个列簇时，针对每个列簇插入数据，最后产生的数据是多个HFile，每个对应一个列族，通过如下操作验证 1. 建立一个有两个列族的表 create 'members','colfam1','colfam2' 2. 在members表中的colfam1中插入50*5
Nginx 官方一个配置实例 ronin47 nginx 配置实例
user www www; worker_processes 5; error_log logs/error.log; pid logs/nginx.pid; worker_rlimit_nofile 8192; events { worker_connections 4096;} http { include conf/mim
java-15.输入一颗二元查找树，将该树转换为它的镜像，即在转换后的二元查找树中，左子树的结点都大于右子树的结点。用递归和循环 bylijinnan java
//use recursion public static void mirrorHelp1(Node node){ if(node==null)return; swapChild(node); mirrorHelp1(node.getLeft()); mirrorHelp1(node.getRight()); } //use no recursion bu
返回null还是empty bylijinnan java apache spring 编程
第一个问题，函数是应当返回null还是长度为0的数组（或集合）？第二个问题，函数输入参数不当时，是异常还是返回null？先看第一个问题有两个约定我觉得应当遵守： 1.返回零长度的数组或集合而不是null（详见《Effective Java》）理由就是，如果返回empty，就可以少了很多not-null判断： List<Person> list
[科技与项目]工作流厂商的战略机遇期 comsci 工作流
在新的战略平衡形成之前，这里有一个短暂的战略机遇期，只有大概最短6年，最长14年的时间，这段时间就好像我们森林里面的小动物，在秋天中，必须抓紧一切时间存储坚果一样，否则无法熬过漫长的冬季。。。。在微软，甲骨文，谷歌，IBM,SONY
过度设计-举例 cuityang 过度设计
过度设计，需要更多设计时间和测试成本，如无必要，还是尽量简洁一些好。未来的事情，比如访问量，比如数据库的容量，比如是否需要改成分布式都是无法预料的再举一个例子，对闰年的判断逻辑：　　1、 if($Year%4==0) return True; else return Fasle; 　　2、if ( ($Year%4==0 &am
java进阶，《Java性能优化权威指南》试读 darkblue086 java性能优化
记得当年随意读了微软出版社的.NET 2.0应用程序调试，才发现调试器如此强大，应用程序开发调试其实真的简单了很多，不仅仅是因为里面介绍了很多调试器工具的使用，更是因为里面寻找问题并重现问题的思想让我震撼，时隔多年，Java已经如日中天，成为许多大型企业应用的首选，而今天，这本《Java性能优化权威指南》让我再次找到了这种感觉，从不经意的开发过程让我刮目相看，原来性能调优不是简单地看看热点在哪里，
网络学习笔记初识OSI七层模型与TCP协议 dcj3sjt126com 学习笔记
协议：在计算机网络中通信各方面所达成的、共同遵守和执行的一系列约定　　计算机网络的体系结构：计算机网络的层次结构和各层协议的集合。　　两类服务：　　面向连接的服务通信双方在通信之前先建立某种状态，并在通信过程中维持这种状态的变化，同时为服务对象预先分配一定的资源。这种服务叫做面向连接的服务。　　面向无连接的服务通信双方在通信前后不建立和维持状态，不为服务对象
mac中用命令行运行mysql dcj3sjt126com mysql linux mac
参考这篇博客：http://www.cnblogs.com/macro-cheng/archive/2011/10/25/mysql-001.html 感觉workbench不好用（有点先入为主了）。 1，安装mysql 在mysql的官方网站下载 mysql 5.5.23 http://www.mysql.com/downloads/mysql/，根据我的机器的配置情况选择了64
MongDB查询（1）——基本查询[五] eksliang mongodb mongodb 查询 mongodb find
MongDB查询转载请出自出处：http://eksliang.iteye.com/blog/2174452 一、find简介 MongoDB中使用find来进行查询。 API:如下 function ( query , fields , limit , skip, batchSize, options ){.....} 参数含义： query:查询参数 fie
base64，加密解密经融加密，对接 y806839048 经融加密对接
String data0 = new String(Base64.encode(bo.getPaymentResult().getBytes(("GBK")))); String data1 = new String(Base64.decode(data0.toCharArray()),"GBK"); // 注意编码格式，注意用于加密，解密的要是同
JavaWeb之JSP概述 ihuning javaweb
什么是JSP？为什么使用JSP？ JSP表示Java Server Page，即嵌有Java代码的HTML页面。使用JSP是因为在HTML中嵌入Java代码比在Java代码中拼接字符串更容易、更方便和更高效。 JSP起源在很多动态网页中，绝大部分内容都是固定不变的，只有局部内容需要动态产生和改变。如果使用Servl
apple watch 指南啸笑天 apple
1. 文档 WatchKit Programming Guide（中译在线版 By @CocoaChina）译文译者原文概览 - 开始为 Apple Watch 进行开发 @星夜暮晨 Overview - Developing for Apple Watch 概览 - 配置 Xcode 项目 - Overview - Configuring Yo
java经典的基础题目 macroli java 编程
1.列举出 10个JAVA语言的优势 a:免费，开源，跨平台(平台独立性)，简单易用，功能完善，面向对象，健壮性，多线程，结构中立，企业应用的成熟平台, 无线应用 2.列举出JAVA中10个面向对象编程的术语 a:包，类，接口，对象，属性，方法，构造器，继承，封装，多态，抽象，范型 3.列举出JAVA中6个比较常用的包 Java.lang;java.util;java.io;java.sql;ja
你所不知道神奇的js replace正则表达式 qiaolevip 每天进步一点点学习永无止境纵观千象 regex
var v = 'C9CFBAA3CAD0'; console.log(v); var arr = v.split(''); for (var i = 0; i < arr.length; i ++) { if (i % 2 == 0) arr[i] = '%' + arr[i]; } console.log(arr.join('')); console.log(v.r
[一起学Hive]之十五-分析Hive表和分区的统计信息(Statistics) superlxw1234 hive hive分析表 hive统计信息 hive Statistics
关键字：Hive统计信息、分析Hive表、Hive Statistics 类似于Oracle的分析表，Hive中也提供了分析表和分区的功能，通过自动和手动分析Hive表，将Hive表的一些统计信息存储到元数据中。表和分区的统计信息主要包括：行数、文件数、原始数据大小、所占存储大小、最后一次操作时间等； 14.1 新表的统计信息对于一个新创建
Spring Boot 1.2.5 发布 wiselyman spring boot
Spring Boot 1.2.5已在7月2日发布，现在可以从spring的maven库和maven中心库下载。这个版本是一个维护的发布版，主要是一些修复以及将Spring的依赖提升至4.1.7(包含重要的安全修复)。官方建议所有的Spring Boot用户升级这个版本。项目首页 | 源