将网页文字保存为Word文档的PHP代码

网极科技1年前代码笔记250

以下是将网页文字保存为Word文档的PHP代码示例:

<?php
// 获取网页内容并保存为Word文件
function saveAsWord($url, $fileName)
{
    // 获取网页内容
    $content = file_get_contents($url);
    $content = strip_tags($content);

    // 定义Word文件内容
    $wordContent = '<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns="http://www.w3.org/TR/REC-html40"><head><meta http-equiv=Content-Type content="text/html; charset=utf-8"><title></title></head><body>';

    // 将网页内容插入Word文件
    $wordContent .= $content;
    $wordContent .= '</body></html>';

    // 设置HTTP头
    header("Content-type: application/vnd.ms-word");
    header("Content-Disposition:attachment;filename=".$fileName.".doc");

    // 输出Word文件内容
    echo $wordContent;
}

// 取得要保存为Word文档的网页链接
$url = 'https://www.example.com';

// 取得要保存的文件名
$fileName = '示例文档';

// 调用保存为Word文档的函数
saveAsWord($url, $fileName);

?>

以上代码中,我们使用file_get_contents()函数获取指定链接的网页内容,然后使用strip_tags()函数去除网页中的所有HTML标签,最后将处理后的内容插入到Word文档中并输出。为了让浏览器直接弹出下载对话框,我们设置了HTTP头Content-type为application/vnd.ms-word并设置Content-Disposition为attachment。这样,浏览器就会自动下载并打开该文件了。

相关文章

Linux使用supervisor创建守护进程方法

Linux使用supervisor创建守护进程方法

下载最新的supervisor安装包: supervisor-4.2.5.tar.gz 安装步骤 wget https://www.wangjikeji.com/uploads/upload...

centos7.6安装php7.4

centos7.6安装php7.4

在CentOS 7.6上安装PHP 7.4,你可以按照以下步骤进行操作: 首先,确保你的系统已经更新到最新的软件包版本。你可以使用以下命令来更新系统: sudo yum update 接下来,添...

不懂技术也能将网页制作成Windows桌面exe文件

不懂技术也能将网页制作成Windows桌面exe文件

基于electron将网页制作成Windows桌面exe文件,使用开源的nativefier可以简单将网页打包成Windows桌面exe文件效果如下图:nativefier开源地址: https:/...

仿真气球冒险任务(BART)的简单网页版实现

仿真气球冒险任务(BART)的简单网页版实现

仿真气球冒险任务(BART)模拟真实世界的风险情境, 具有高生态性, 稳定性和可靠性等优点, 已经成为风险决策研究中最常用的实验范式之一。我们用纯html+js+css简单实现了下,可以在浏览器中运行...

【精选】PHP将股票日K线数据转换为周K线数据

【精选】PHP将股票日K线数据转换为周K线数据

可以使用PHP来将股票日K线数据转换为周K线数据。具体实现方法如下:获取日K线数据,例如从数据库中查询出所有日期的股票数据,保存在一个数组中,每个元素包含如下信息: $day_data = [...

火车头采集分页多页数据

火车头采集分页多页数据

在使用火车头采集器时,遇到有分页多页的情况出现,可进行如下设置进行采集1 在第二步,采集内容规则中设置“分页获取规则”,即页码标签位置2 在标签编辑页面勾选  该标签在分页中匹配 ...