Cursor实践项目-10-远程会议、培训、视频,屏幕自动截图、手动截图

项目说明

cursor项目实践-10-远程会议、培训、视频,屏幕自动截图、手动截图

耗费时间:约2小时

Cursor使用次数:10左右

在远程会议、线上培训、视频教程学习中,很多时候并没有拿到会议资料,不利于回顾会议内容和视频的内容。通过本实践项目,自动截图屏幕指定位置的画面变化的部分,并且可以手动截图。

类似的工具,如果需要,你就可以安排cursor来帮你实现。

成果展示

python实现的自动截图工具,支持自动截图、手动截图、图片压缩等功能。含以下功能:

  1. 指定位置或者全屏截图,指定位置可以拖动框体去选择位置。
  2. 支持自动截图,截图时间间隔可以设置。
  3. 支持相同图片不保存,不同图片保存。
  4. 支持手动截图,使用快捷键触发。
  5. 截图为webp格式,自动压缩会保存在本地。
  6. 使用python进行编写,带有界面,界面上可以设置
    • 指定位置/全屏
    • 截图时间间隔
    • 是否图片去重,根据相似度去重,相似度设置
    • 图片压缩率
    • 图片保存地址
结果动图

前置准备

  • Cursor

  • Gemini CLI

    • 版本:0.1.13
  • 整体流程

      • 设置cursor规则->设置项目规则(10xUse)->和LLM沟通需求->cursor编码->调试输出

问题记录

  1. 问题1:cursor现在的版本,cmd+k也会消耗次数。因此一些小操作,可以交由gemini cli来完成。
    • 例如:翻译、生成代码片段等
    • 例如:生成git常用命令速查表
    • 例如:生成项目文档和教程索引

使用心得

  1. 活用10xUse,可以减少Cursor的使用次数
  2. 使用Gemini CLI辅助,双模型协同工作,可以更高效的完成项目,但是主要控制gemini cli的权限。

项目详细步骤

  1. 梳理需求:首先向Cursor提供了核心需求文件pj-requirement.md,并要求它总结需求,以此来检验它对任务的初步理解。

    • 可以通过Gemini cli,要求翻译为英文
    step-1
  2. 分析需求及编码:要求Cursor分析需求。

    step-1
  3. 开始编码 :cursor生成项目文档,制定步骤,创建python虚拟环境,进入虚拟环境进行依赖安装。开始编码

    • cursor生成项目文档
    • 生成执行步骤
    • 创建python虚拟环境
    • 进入虚拟环境进行依赖安装
    • 生成代码
    step-2 step-2
  4. 根据步骤生成代码

    • cursor生成代码
    • 2次要求后,完成代码的初步编写
    step-2
  5. 进行验证

    • 对基础功能进行测试,完成了自动截屏,手动截屏,压缩存储等核心功能。
    • 核心未完成功能:
      • 区域选择异常,无法选择,希望通过一个框体,进行拖动选择截屏区域
      • 手动截屏的按钮生效了,但是快捷键未生效,macos系统
      • 自动录屏功能,两个图片相似度未判定,导致一致在截屏
  6. 提交问题,进行修复,如此循环

  7. 设定初始版本,提交GIT

    step-2
  8. 设置快捷指令

    • 设置快捷指令,快速唤起使用。