Empirical Orthogonal Function (EOF) and Maximum Covariance Analysis (MCA)

Empirical Orthogonal Function (EOF) and Maximum Covariance Analysis (MCA)#

Before proceeding with all the steps, first import some necessary libraries and packages

import xarray as xr
import easyclimate as ecl
import matplotlib.pyplot as plt
import cartopy.crs as ccrs

Maximum Covariance Analysis#

Be limited to the East Asia region for precipitation and temperature.

precip_data_EA = precip_data.sel(lon = slice(105, 130), lat = slice(20, 40))
t_data_EA = t_data.sel(lon = slice(105, 130), lat = slice(20, 40)).sel(level = 1000)

Maximum Covariance Analysis (MCA) between two data sets.

mca_model = ecl.eof.get_MCA_model(precip_data_EA, t_data_EA, lat_dim="lat", lon_dim="lon", n_modes=2, use_coslat=True,random_state=0)
mca_analysis_result = ecl.eof.calc_MCA_analysis(mca_model)
mca_analysis_result.to_zarr("mca_analysis_result.zarr")

Now load the data

mca_analysis_result = ecl.open_datanode("./mca_analysis_result.zarr")
mca_analysis_result

easyclimate.DataNode

'root'

▶root

▶EOF

▶left_EOF:xarray.Dataset

<xarray.Dataset> Size: 7kB
Dimensions:   (lat: 18, mode: 2, lon: 22)
Coordinates:
  * lat       (lat) float64 144B 20.75 21.87 22.99 24.11 ... 37.57 38.69 39.81
    level     int32 4B ...
  * lon       (lon) float64 176B 105.8 106.9 108.0 109.1 ... 127.1 128.2 129.4
  * mode      (mode) int64 16B 1 2
Data variables:
    left_EOF  (mode, lat, lon) float64 6kB dask.array<chunksize=(2, 18, 22), meta=np.ndarray>

▶right_EOF:xarray.Dataset

<xarray.Dataset> Size: 7kB
Dimensions:    (lat: 18, lon: 22, mode: 2)
Coordinates:
  * lat        (lat) float64 144B 20.75 21.87 22.99 24.11 ... 37.57 38.69 39.81
    level      int32 4B ...
  * lon        (lon) float64 176B 105.8 106.9 108.0 109.1 ... 127.1 128.2 129.4
  * mode       (mode) int64 16B 1 2
Data variables:
    right_EOF  (mode, lat, lon) float64 6kB dask.array<chunksize=(2, 18, 22), meta=np.ndarray>

▶PC

▶left_PC:xarray.Dataset

<xarray.Dataset> Size: 11kB
Dimensions:  (mode: 2, time: 468)
Coordinates:
    level    int32 4B ...
  * mode     (mode) int64 16B 1 2
  * time     (time) datetime64[ns] 4kB 1982-01-31T18:00:00 ... 2020-12-31T18:...
Data variables:
    left_PC  (mode, time) float64 7kB dask.array<chunksize=(2, 468), meta=np.ndarray>

▶right_PC:xarray.Dataset

<xarray.Dataset> Size: 11kB
Dimensions:   (mode: 2, time: 468)
Coordinates:
    level     int32 4B ...
  * mode      (mode) int64 16B 1 2
  * time      (time) datetime64[ns] 4kB 1982-01-01 1982-02-01 ... 2020-12-01
Data variables:
    right_PC  (mode, time) float64 7kB dask.array<chunksize=(2, 468), meta=np.ndarray>

▶correlation_coefficients_X:xarray.Dataset

<xarray.Dataset> Size: 68B
Dimensions:                     (mode_x: 2, mode_y: 2)
Coordinates:
    level                       int32 4B ...
  * mode_x                      (mode_x) int64 16B 1 2
  * mode_y                      (mode_y) int64 16B 1 2
Data variables:
    correlation_coefficients_X  (mode_x, mode_y) float64 32B dask.array<chunksize=(2, 2), meta=np.ndarray>

▶correlation_coefficients_Y:xarray.Dataset

<xarray.Dataset> Size: 68B
Dimensions:                     (mode_x: 2, mode_y: 2)
Coordinates:
    level                       int32 4B ...
  * mode_x                      (mode_x) int64 16B 1 2
  * mode_y                      (mode_y) int64 16B 1 2
Data variables:
    correlation_coefficients_Y  (mode_x, mode_y) float64 32B dask.array<chunksize=(2, 2), meta=np.ndarray>

▶covariance_fraction:xarray.Dataset

▶cross_correlation_coefficients:xarray.Dataset

▶fraction_variance_X_explained_by_X:xarray.Dataset

▶fraction_variance_Y_explained_by_X:xarray.Dataset

▶fraction_variance_Y_explained_by_Y:xarray.Dataset

▶heterogeneous_patterns

▶left_heterogeneous_patterns:xarray.Dataset

<xarray.Dataset> Size: 7kB
Dimensions:                      (lat: 18, mode: 2, lon: 22)
Coordinates:
  * lat                          (lat) float64 144B 20.75 21.87 ... 38.69 39.81
    level                        int32 4B ...
  * lon                          (lon) float64 176B 105.8 106.9 ... 128.2 129.4
  * mode                         (mode) int64 16B 1 2
Data variables:
    left_heterogeneous_patterns  (mode, lat, lon) float64 6kB dask.array<chunksize=(2, 18, 22), meta=np.ndarray>

▶pvalues_of_left_heterogeneous_patterns:xarray.Dataset

<xarray.Dataset> Size: 7kB
Dimensions:                                 (lat: 18, lon: 22, mode: 2)
Coordinates:
  * lat                                     (lat) float64 144B 20.75 ... 39.81
    level                                   int32 4B ...
  * lon                                     (lon) float64 176B 105.8 ... 129.4
  * mode                                    (mode) int64 16B 1 2
Data variables:
    pvalues_of_left_heterogeneous_patterns  (mode, lat, lon) float64 6kB dask.array<chunksize=(2, 18, 22), meta=np.ndarray>

▶pvalues_of_right_heterogeneous_patterns:xarray.Dataset

<xarray.Dataset> Size: 7kB
Dimensions:                                  (lat: 18, lon: 22, mode: 2)
Coordinates:
  * lat                                      (lat) float64 144B 20.75 ... 39.81
    level                                    int32 4B ...
  * lon                                      (lon) float64 176B 105.8 ... 129.4
  * mode                                     (mode) int64 16B 1 2
Data variables:
    pvalues_of_right_heterogeneous_patterns  (mode, lat, lon) float64 6kB dask.array<chunksize=(2, 18, 22), meta=np.ndarray>

▶right_heterogeneous_patterns:xarray.Dataset

<xarray.Dataset> Size: 7kB
Dimensions:                       (lat: 18, lon: 22, mode: 2)
Coordinates:
  * lat                           (lat) float64 144B 20.75 21.87 ... 38.69 39.81
    level                         int32 4B ...
  * lon                           (lon) float64 176B 105.8 106.9 ... 128.2 129.4
  * mode                          (mode) int64 16B 1 2
Data variables:
    right_heterogeneous_patterns  (mode, lat, lon) float64 6kB dask.array<chunksize=(2, 18, 22), meta=np.ndarray>

▶homogeneous_patterns

▶left_homogeneous_patterns:xarray.Dataset

<xarray.Dataset> Size: 7kB
Dimensions:                    (lat: 18, mode: 2, lon: 22)
Coordinates:
  * lat                        (lat) float64 144B 20.75 21.87 ... 38.69 39.81
    level                      int32 4B ...
  * lon                        (lon) float64 176B 105.8 106.9 ... 128.2 129.4
  * mode                       (mode) int64 16B 1 2
Data variables:
    left_homogeneous_patterns  (mode, lat, lon) float64 6kB dask.array<chunksize=(2, 18, 22), meta=np.ndarray>

▶pvalues_of_left_homogeneous_patterns:xarray.Dataset

<xarray.Dataset> Size: 7kB
Dimensions:                               (lat: 18, lon: 22, mode: 2)
Coordinates:
  * lat                                   (lat) float64 144B 20.75 ... 39.81
    level                                 int32 4B ...
  * lon                                   (lon) float64 176B 105.8 ... 129.4
  * mode                                  (mode) int64 16B 1 2
Data variables:
    pvalues_of_left_homogeneous_patterns  (mode, lat, lon) float64 6kB dask.array<chunksize=(2, 18, 22), meta=np.ndarray>

▶pvalues_of_right_homogeneous_patterns:xarray.Dataset

<xarray.Dataset> Size: 7kB
Dimensions:                                (lat: 18, lon: 22, mode: 2)
Coordinates:
  * lat                                    (lat) float64 144B 20.75 ... 39.81
    level                                  int32 4B ...
  * lon                                    (lon) float64 176B 105.8 ... 129.4
  * mode                                   (mode) int64 16B 1 2
Data variables:
    pvalues_of_right_homogeneous_patterns  (mode, lat, lon) float64 6kB dask.array<chunksize=(2, 18, 22), meta=np.ndarray>

▶right_homogeneous_patterns:xarray.Dataset

<xarray.Dataset> Size: 7kB
Dimensions:                     (lat: 18, lon: 22, mode: 2)
Coordinates:
  * lat                         (lat) float64 144B 20.75 21.87 ... 38.69 39.81
    level                       int32 4B ...
  * lon                         (lon) float64 176B 105.8 106.9 ... 128.2 129.4
  * mode                        (mode) int64 16B 1 2
Data variables:
    right_homogeneous_patterns  (mode, lat, lon) float64 6kB dask.array<chunksize=(2, 18, 22), meta=np.ndarray>

▶squared_covariance_fraction:xarray.Dataset

Draw results for leading modes

fig = plt.figure(figsize = (9, 6))
fig.subplots_adjust(hspace = 0.15, wspace = 0.1)
gs = fig.add_gridspec(3, 2)

proj = ccrs.PlateCarree(central_longitude = 200)
proj_trans = ccrs.PlateCarree()

# ---------------
axi = fig.add_subplot(gs[0:2, 0], projection = proj)
draw_data = mca_analysis_result["EOF/left_EOF"].sel(mode = 2).left_EOF
draw_data.plot.contourf(
    ax = axi, levels = 21,
    transform = proj_trans,
    cbar_kwargs={"location": "bottom", "aspect": 50, "pad" : 0.1}
)
axi.coastlines()
axi.gridlines(draw_labels=["left", "bottom"], color="grey", alpha=0.5, linestyle="--")
axi.set_title('left EOF2')

# ---------------
axi = fig.add_subplot(gs[2, 0])
ecl.plot.line_plot_with_threshold(mca_analysis_result["PC/left_PC"].sel(mode = 1).left_PC, line_plot=False)
axi.set_ylim(-0.04, 0.04)

# ---------------
axi = fig.add_subplot(gs[0:2, 1], projection = proj)
draw_data = mca_analysis_result["EOF/right_EOF"].sel(mode = 2).right_EOF
draw_data.plot.contourf(
    ax = axi, levels = 21,
    transform = proj_trans,
    cbar_kwargs={"location": "bottom", "aspect": 50, "pad" : 0.1}
)
axi.coastlines()
axi.gridlines(draw_labels=["left", "bottom"], color="grey", alpha=0.5, linestyle="--")
axi.set_title('right EOF2')

# ---------------
axi = fig.add_subplot(gs[2, 1])
ecl.plot.line_plot_with_threshold(mca_analysis_result["PC/right_PC"].sel(mode = 1).right_PC, line_plot=False)
axi.set_ylim(-0.04, 0.04)

(-0.04, 0.04)

Draw the figures for both homogeneous and heterogeneous patterns

proj = ccrs.PlateCarree(central_longitude = 200)
proj_trans = ccrs.PlateCarree()

fig, ax = plt.subplots(2, 2, figsize = (9, 8), subplot_kw={"projection": proj})

# ---------------
axi = ax[0, 0]

draw_data = mca_analysis_result["heterogeneous_patterns/left_heterogeneous_patterns"].sel(mode = 2).left_heterogeneous_patterns
p_data = mca_analysis_result["heterogeneous_patterns/pvalues_of_left_heterogeneous_patterns"].sel(mode = 2).pvalues_of_left_heterogeneous_patterns

draw_data.plot.contourf(
    ax = axi, levels = 21,
    transform = proj_trans,
    cbar_kwargs={"location": "bottom", "aspect": 50, "pad" : 0.1}
)
ecl.plot.draw_significant_area_contourf(p_data, ax = axi, thresh=0.1, transform=proj_trans)

axi.coastlines()
axi.gridlines(draw_labels=["left", "bottom"], color="grey", alpha=0.5, linestyle="--")
axi.set_title('Left Heterogeneous Patterns')

# ---------------
axi = ax[0, 1]

draw_data = mca_analysis_result["heterogeneous_patterns/right_heterogeneous_patterns"].sel(mode = 2).right_heterogeneous_patterns
p_data = mca_analysis_result["heterogeneous_patterns/pvalues_of_right_heterogeneous_patterns"].sel(mode = 2).pvalues_of_right_heterogeneous_patterns

draw_data.plot.contourf(
    ax = axi, levels = 21,
    transform = proj_trans,
    cbar_kwargs={"location": "bottom", "aspect": 50, "pad" : 0.1}
)
ecl.plot.draw_significant_area_contourf(p_data, ax = axi, thresh=0.1, transform=proj_trans)

axi.coastlines()
axi.gridlines(draw_labels=["left", "bottom"], color="grey", alpha=0.5, linestyle="--")
axi.set_title('Right Heterogeneous Patterns')

# ---------------
axi = ax[1, 0]

draw_data = mca_analysis_result["homogeneous_patterns/left_homogeneous_patterns"].sel(mode = 2).left_homogeneous_patterns
p_data = mca_analysis_result["homogeneous_patterns/pvalues_of_left_homogeneous_patterns"].sel(mode = 2).pvalues_of_left_homogeneous_patterns

draw_data.plot.contourf(
    ax = axi, levels = 21,
    transform = proj_trans,
    cbar_kwargs={"location": "bottom", "aspect": 50, "pad" : 0.1}
)
ecl.plot.draw_significant_area_contourf(p_data, ax = axi, thresh=0.1, transform=proj_trans)

axi.coastlines()
axi.gridlines(draw_labels=["left", "bottom"], color="grey", alpha=0.5, linestyle="--")
axi.set_title('Left Homogeneous Patterns')

# ---------------
axi = ax[1, 1]

draw_data = mca_analysis_result["homogeneous_patterns/right_homogeneous_patterns"].sel(mode = 2).right_homogeneous_patterns
p_data = mca_analysis_result["homogeneous_patterns/pvalues_of_right_homogeneous_patterns"].sel(mode = 2).pvalues_of_right_homogeneous_patterns

draw_data.plot.contourf(
    ax = axi, levels = 21,
    vmax = 0.8, vmin = -0.8,
    cmap = "RdBu_r",
    transform = proj_trans,
    cbar_kwargs={"location": "bottom", "aspect": 50, "pad" : 0.1}
)
ecl.plot.draw_significant_area_contourf(p_data, ax = axi, thresh=0.1, transform=proj_trans)

axi.coastlines()
axi.gridlines(draw_labels=["left", "bottom"], color="grey", alpha=0.5, linestyle="--")
axi.set_title('Right Homogeneous Patterns')

Left Heterogeneous Patterns, Right Heterogeneous Patterns, Left Homogeneous Patterns, Right Homogeneous Patterns

Text(0.5, 1.0, 'Right Homogeneous Patterns')

Total running time of the script: (0 minutes 6.648 seconds)

Empirical Orthogonal Function (EOF) and Maximum Covariance Analysis (MCA)

Contents

Empirical Orthogonal Function (EOF) and Maximum Covariance Analysis (MCA)#

Empirical Orthogonal Function#

Rotated Empirical Orthogonal Function#

Maximum Covariance Analysis#