将网页文字保存为Word文档的PHP代码

网极科技2年前代码笔记333

以下是将网页文字保存为Word文档的PHP代码示例:

<?php
// 获取网页内容并保存为Word文件
function saveAsWord($url, $fileName)
{
    // 获取网页内容
    $content = file_get_contents($url);
    $content = strip_tags($content);

    // 定义Word文件内容
    $wordContent = '<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns="http://www.w3.org/TR/REC-html40"><head><meta http-equiv=Content-Type content="text/html; charset=utf-8"><title></title></head><body>';

    // 将网页内容插入Word文件
    $wordContent .= $content;
    $wordContent .= '</body></html>';

    // 设置HTTP头
    header("Content-type: application/vnd.ms-word");
    header("Content-Disposition:attachment;filename=".$fileName.".doc");

    // 输出Word文件内容
    echo $wordContent;
}

// 取得要保存为Word文档的网页链接
$url = 'https://www.example.com';

// 取得要保存的文件名
$fileName = '示例文档';

// 调用保存为Word文档的函数
saveAsWord($url, $fileName);

?>

以上代码中,我们使用file_get_contents()函数获取指定链接的网页内容,然后使用strip_tags()函数去除网页中的所有HTML标签,最后将处理后的内容插入到Word文档中并输出。为了让浏览器直接弹出下载对话框,我们设置了HTTP头Content-type为application/vnd.ms-word并设置Content-Disposition为attachment。这样,浏览器就会自动下载并打开该文件了。

相关文章

使用Cloudfare R2云存储替代阿里云腾讯云存储_使用php进行Cloudfare R2存取操作

使用Cloudfare R2云存储替代阿里云腾讯云存储_使用php进行Cloudfare R2存取操作

Cloudfare主要是做全球CDN加速,他的存储R2功能只计算存储和请求费用,不计算流量费用,这点在目前云存储市场上算是独一无二了。比如我们常用的阿里云,他OSS云存储主要构成是流量费用。然后我们看...

centos7.6安装php7.4

centos7.6安装php7.4

在CentOS 7.6上安装PHP 7.4,你可以按照以下步骤进行操作: 首先,确保你的系统已经更新到最新的软件包版本。你可以使用以下命令来更新系统: sudo yum update 接下来,添...

使用xunsearch进行php全文检索

使用xunsearch进行php全文检索

迅搜(xunsearch)是采用 C/C++ 基于 xapian 和 scws 开发的全文搜索引擎解决方案,适用于php全文检索、mysql全文检索和各种站内搜索。支持海量数据高速检索,功能强大、...

通过阿里云实现IPv6升级改造

通过阿里云实现IPv6升级改造

场景示例某些企业现有的IT系统部署在本地IDC机房,IDC机房为纯IPv4网络,企业因业务发展需求,需要面向IPv6客户端提供服务。但是,使企业现有IT系统支持IPv6是一个复杂的系统工程,改造难度大...

为什么要用ServerLess架构部署企业官网

为什么要用ServerLess架构部署企业官网

企业官网作为企业的重要对外门户,承载的功能不然而喻。 企业官网经常遇到的问题被攻击很多非技术企业对于网站的运维并不擅长,更加没有专业的工程师进行运维,遇到攻击,手足无措,只能眼睁睁看着网站打...

火车头采集分页多页数据

火车头采集分页多页数据

在使用火车头采集器时,遇到有分页多页的情况出现,可进行如下设置进行采集1 在第二步,采集内容规则中设置“分页获取规则”,即页码标签位置2 在标签编辑页面勾选  该标签在分页中匹配 ...