码农知识堂 - 1000bd
  •   Python
  •   PHP
  •   JS/TS
  •   JAVA
  •   C/C++
  •   C#
  •   GO
  •   Kotlin
  •   Swift
  • gpt-4o看图说话-根据图片回答问题


    问题:中国的人口老龄化究竟有多严重?

    代码下实现如下:(直接调用openai的chat接口)

    import os

    import base64

    import requests

    def encode_image(image_path):

        """

        对图片文件进行 Base64 编码

        输入:

             - image_path:图片的文件路径

        输出:

             - 编码后的 Base64 字符串

        """

        # 二进制读取模式打开图片文件,

        with open(image_path, "rb") as image_file:

            # 将编码后的字节串解码为 UTF-8 字符串,以便于在文本环境中使用。

            return base64.b64encode(image_file.read()).decode("utf-8")

    # 中文 Prompt 指令

    question = "中国的人口老龄化究竟有多严重?"

    prompt = (

        f"你的任务是根据图片回答问题,{question}详细回答。"

    )

    # 对本地多张图片进行 Base64 编码

    images = os.listdir("./images")

    images.sort()

    images.remove('.ipynb_checkpoints')

    print(images)

    base64_images = [encode_image("./images/" + image) for image in images]

    # 组织用户消息

    user_content = [{"type": "text", "text": prompt}]

    base64_images = [

        {

            "type": "image_url",

            "image_url": {

                "url": f"data:image/jpeg;base64,{base64_image}",

                "detail": "high",

            },

        }

        for base64_image in base64_images

    ]

    user_content.extend(base64_images)

    messages_template = [{"role": "user", "content": user_content}]

    # 构造请求参数

    payload = {

        "model": "gpt-4o",

        "messages": messages_template,

        "max_tokens": 1600,

        "temperature": 0,

        "seed": 2024,

    }

    # OpenAI API Key

    api_key = "sk-xxx”

    # 请求头

    headers = {"Content-Type": "application/json", "Authorization": f"Bearer {api_key}"}

    # 发送 POST 请求

    response = requests.post(

        "https://api.openai.com/v1/chat/completions",

        headers=headers, json=payload

    )

    # 打印生成结果

    print(response.json())

    result = response.json()["choices"][0]["message"]["content"]

    print(result)

    输出结果:

  • 相关阅读:
    Java | Leetcode Java题解之第122题买卖股票的最佳时机II
    [数据集][目标检测]焊接件表面缺陷检测数据集VOC+YOLO格式2292张10类别
    Syntax Error: Error: PostCSS received undefined instead of CSS string (已解决)
    svelte组件:Svelte3自定义Navbar+Tabbr组件|svelte自定义插件
    设计模式-装饰模式
    车辆大全和车牌识别系统毕业设计,车牌识别系统设计与实现,车牌AI识别系统论文毕设作品参考
    HTTP/1.1协议的状态码
    【C++】C++ 引用详解 ⑩ ( 常量引用案例 )
    JDK API Diff Report Generator-Java版本对比工具
    【ASM】字节码操作 ClassWriter 类介绍与使用
  • 原文地址:https://blog.csdn.net/wxl781227/article/details/140308546
  • 最新文章
  • 攻防演习之三天拿下官网站群
    数据安全治理学习——前期安全规划和安全管理体系建设
    企业安全 | 企业内一次钓鱼演练准备过程
    内网渗透测试 | Kerberos协议及其部分攻击手法
    0day的产生 | 不懂代码的"代码审计"
    安装scrcpy-client模块av模块异常,环境问题解决方案
    leetcode hot100【LeetCode 279. 完全平方数】java实现
    OpenWrt下安装Mosquitto
    AnatoMask论文汇总
    【AI日记】24.11.01 LangChain、openai api和github copilot
  • 热门文章
  • 十款代码表白小特效 一个比一个浪漫 赶紧收藏起来吧!!!
    奉劝各位学弟学妹们,该打造你的技术影响力了!
    五年了,我在 CSDN 的两个一百万。
    Java俄罗斯方块,老程序员花了一个周末,连接中学年代!
    面试官都震惊,你这网络基础可以啊!
    你真的会用百度吗?我不信 — 那些不为人知的搜索引擎语法
    心情不好的时候,用 Python 画棵樱花树送给自己吧
    通宵一晚做出来的一款类似CS的第一人称射击游戏Demo!原来做游戏也不是很难,连憨憨学妹都学会了!
    13 万字 C 语言从入门到精通保姆级教程2021 年版
    10行代码集2000张美女图,Python爬虫120例,再上征途
Copyright © 2022 侵权请联系2656653265@qq.com    京ICP备2022015340号-1
正则表达式工具 cron表达式工具 密码生成工具

京公网安备 11010502049817号