import numpy as np
import pandas as pd
import sys
import os
import matplotlib.pyplot as plt
import gstlearn as gl
import gstlearn.plot as gp
import gstlearn.document as gdoc

gdoc.setNoScroll()

grid = gl.DbGrid.create(nx=[150,100])
ngrid = grid.getSampleNumber()
grid.addColumns(gl.VectorHelper.simulateGaussian(ngrid),"SG1",gl.ELoc.Z)
grid.addColumns(gl.VectorHelper.simulateGaussian(ngrid),"SG2",gl.ELoc.Z)
grid.addColumns(gl.VectorHelper.simulateGaussian(ngrid),"SG3",gl.ELoc.Z)
grid

Data Base Grid Characteristics
==============================

Data Base Summary
-----------------
File is organized as a regular grid
Space dimension              = 2
Number of Columns            = 6
Total number of samples      = 15000

Grid characteristics:
---------------------
Origin :      0.000     0.000
Mesh   :      1.000     1.000
Number :        150       100

Variables
---------
Column = 0 - Name = rank - Locator = NA
Column = 1 - Name = x1 - Locator = x1
Column = 2 - Name = x2 - Locator = x2
Column = 3 - Name = SG1 - Locator = NA
Column = 4 - Name = SG2 - Locator = NA
Column = 5 - Name = SG3 - Locator = z1

nech = 100
data = gl.Db.createFromBox(nech, grid.getCoorMinimum(), grid.getCoorMaximum())
data.addColumns(gl.VectorHelper.simulateGaussian(nech),"SD1",gl.ELoc.Z)
data.addColumns(gl.VectorHelper.simulateGaussian(nech),"SD2",gl.ELoc.Z)
data.addColumns(gl.VectorHelper.simulateGaussian(nech),"SD3",gl.ELoc.Z)
data

Data Base Characteristics
=========================

Data Base Summary
-----------------
File is organized as a set of isolated points
Space dimension              = 2
Number of Columns            = 6
Total number of samples      = 100

Variables
---------
Column = 0 - Name = rank - Locator = NA
Column = 1 - Name = x-1 - Locator = x1
Column = 2 - Name = x-2 - Locator = x2
Column = 3 - Name = SD1 - Locator = NA
Column = 4 - Name = SD2 - Locator = NA
Column = 5 - Name = SD3 - Locator = z1

ax = grid.plot("SG1")
ax = data.plot(color="white")
ax.decoration(title="Data")

opers = gl.EStatOption.fromKeys(["NUM", "MEAN", "STDV"])

gl.dbStatisticsMono(data, ["SD*"], opers = opers)

        Number       Mean   St. Dev.
SD1    100.000      0.161      1.028
SD2    100.000     -0.293      1.020
SD3    100.000      0.118      0.910

gl.dbStatisticsCorrel(data, ["SD*"])

           SD1        SD2        SD3
SD1      1.000     -0.006     -0.186
SD2     -0.006      1.000      0.002
SD3     -0.186      0.002      1.000

gl.dbStatisticsPrint(data, ["SD*"], opers=opers, flagCorrel=True)

        Number       Mean   St. Dev.
SD1        100      0.161      1.028
SD2        100     -0.293      1.020
SD3        100      0.118      0.910

Number of isotopic active samples = 100
Correlation matrix
                  [,1]       [,2]       [,3]
       [1,]      1.000     -0.006     -0.186
       [2,]     -0.006      1.000      0.002
       [3,]     -0.186      0.002      1.000

gl.dbStatisticsMulti(data, ["SD*"], gl.EStatOption.MEAN,  flagMono = True)

Mean
----
SD1      0.161
SD2     -0.293
SD3      0.118

gl.dbStatisticsMulti(data, ["SD*"], gl.EStatOption.MEAN,  flagMono = False)

Mean
----
           SD1        SD2        SD3
SD1      0.161      0.161      0.161
SD2     -0.293     -0.293     -0.293
SD3      0.118      0.118      0.118

gridC = grid.coarsify([5,5])
gridC

Data Base Grid Characteristics
==============================

Data Base Summary
-----------------
File is organized as a regular grid
Space dimension              = 2
Number of Columns            = 6
Total number of samples      = 600

Grid characteristics:
---------------------
Origin :      2.000     2.000
Mesh   :      5.000     5.000
Number :         30        20

Variables
---------
Column = 0 - Name = rank - Locator = NA
Column = 1 - Name = x1 - Locator = x1
Column = 2 - Name = x2 - Locator = x2
Column = 3 - Name = SG1 - Locator = NA
Column = 4 - Name = SG2 - Locator = NA
Column = 5 - Name = SG3 - Locator = z1

tab = gl.dbStatisticsPerCell(data, gridC, gl.EStatOption.MEAN, "SD1")
iuid = gridC.addColumns(tab, "Mean.SD1", gl.ELoc.Z)

ax = gridC.plot("Mean.SD1")

data.setLocators(["SD*"],gl.ELoc.Z)
err = gl.dbStatisticsOnGrid(data, gridC, gl.EStatOption.MEAN)

ax = gp.correlation(gridC,namex="Mean.SD1",namey="Stats.SD1", bins=100)

err = gl.dbStatisticsOnGrid(data, gridC, gl.EStatOption.MEAN, radius=2, 
                            namconv=gl.NamingConvention("Stats.Dilate"))

ax = gridC.plot("Stats.Dilate.SD1")

grid.setLocator("SG1",gl.ELoc.Z, cleanSameLocator=True)
err = gl.dbStatisticsOnGrid(grid, gridC, gl.EStatOption.VAR, radius=2, 
                            namconv=gl.NamingConvention("Var.Disp"))

ax = gridC.plot("Var.Disp.SG1")
ax.decoration(title="Dispersion Variance of blocks into panels")

Statistics on Db¶

Import packages¶

Using the Grid¶