0
点赞
收藏
分享

微信扫一扫

微软行星planetarycomputer云计算平台——JupyterLab电脑环境配置!


行星计算机集线器

行星计算机集线器是计算行星计算机提供的​​数据​​​的便捷选项。Hub 是​​JupyterHub​​​部署,包括一组常用的地理空间和可持续性数据分析包。它启用了​​Dask​​以进行可扩展计算。



在登录

在行星计算机上拥有​​帐户后​​​,您可以登录集线器。访问​​http://planetarycomputer.microsoft.com/compute​​以访问集线器。

微软行星planetarycomputer云计算平台——JupyterLab电脑环境配置!_服务器

Hub 提供多个配置文件来自定义您的计算环境。配置文件决定了您服务器的计算能力和软件环境。当然现在还是内测阶段,所以没有办法获取以下的东西,也就是没有办法进行这一步

微软行星planetarycomputer云计算平台——JupyterLab电脑环境配置!_服务器_02

选择一个配置文件并单击开始以启动您的服务器。当您的服务器上线时,您会看到一个进度条和一些日志。一旦准备就绪,您将被重定向到 Jupyterlab。




停止你的服务器

在集线器上完成会话后,请确保停止服务器以释放消耗的资源。在 Jupyterlab UI 中,选择文件 > 集线器控制面板。这将在​​https://pccompute.westeurope.cloudapp.azure.com/compute/hub/home 上​​打开一个新选项卡,可让您管理服务器。

微软行星planetarycomputer云计算平台——JupyterLab电脑环境配置!_主目录_03

选择停止我的服务器以停止您的服务器并释放您消耗的所有资源。

微软行星planetarycomputer云计算平台——JupyterLab电脑环境配置!_配置文件_04

请注意,我们会自动停止似乎空闲的服务器。




使用 JupyterLab

该​​JupyterLab用户指南​​详细介绍了JupyterLab用户界面。Hub 环境包括一些常见的扩展。

  • Dask Labextension:来自 jupyterlab 的 Dask 诊断。有关更多信息,请参阅使用 Dask 扩展(仅限 Python)。
  • 使用​​jupyterlab-geojson 渲染的 GeoJSON​​。



了解文件系统

您的服务器有一个主目录​/home/jovyan/​​​,您可以在其中存储本地文件。该目录跨会话持续存在;如果您在 中创建文件​​/home/jovyan/​​,请停止您的服务器,然后重新启动它,该文件仍然存在。

之外的所有内容​​/home/jovyan​​都不会跨会话持久化。例如,如果您​​/srv/conda/envs/notebook​​​通过手动ing 包对 Python 环境进行修改,则在停止和启动服务器后该新包将不可用。​​pip install​

您应该只将代码、笔记本和分析文档存储在您的主目录中。值得注意的是,您不应在主目录中存储大量数据。相反,请改用​​Azure Blob 存储之​​类的东西(确保使用西欧区域,这是您的服务器运行的地方)。




环境变量

我们在您的服务器启动时设置了几个环境变量。


多变的



价值



描述



PC_SDK_SUBSCRIPTION_KEY



独一无二的你



用于对​​资产​​​进行​​签名​​以下载数据。



GDAL_DISABLE_READDIR_ON_OPEN



EMPTY_DIR



​​使用 GDAL​​​打开单个 COG 时​​提高 GDAL 性能​​。



GDAL_HTTP_MERGE_CONSECUTIVE_RANGES



是的



通过合并连续的 HTTP 请求来​​提高 GDAL 性能​​。




了解软件环境

您的软件环境由您在启动服务器时选择的配置文件决定。这是一个​​畅达环境​​​位于​​/srv/conda/envs/notebook​​​。该环境包含许多有助于地理空间数据分析的软件库。如前所述​​上述​​​改变你的主目录的环境外部不跨会话持续。如果您​​pip​​​或​​conda​​安装了一个软件包,则下次启动服务器时它不会出现。

如果您使用 Dask 进行可扩展计算,您应该确保您对本地软件环境所做的修改也出现在工作人员身上。Dask 提供了一个​​PipInstallPlugin​​来在 worker 启动时自动安装包





>>> from dask.distributed import PipInstall
>>> plugin = PipInstall(packages=["scikit-learn"], pip_options=["--upgrade"])
>>> client.register_worker_plugin(plugin)





请注意,这会减慢 worker 的启动速度,因为需要在 worker 开始执行任务之前找到并下载包。



举报

相关推荐

0 条评论